我们建议使用移动GUI任务自动化代理V-Droid。与以前利用大型语言模型(LLM)作为发电机直接生成操作的移动代理不同,V-Droid在做出最终决策之前使用LLMS作为验证者来评估候选行动。为了实现这种新颖的范式,我们介绍了一个综合框架,用于构建验证者驱动的移动剂:离散的动作空间构建,再加上仅预填充的工作流程,以加速验证过程,配对进度偏好培训,以显着增强了验证能力,可衡量的验证能力,并有效地缩放 ...
基金会模型(FMS)很好地适应了具有微调和联合学习(FL)的特定领域或任务,从而有可能使用智障本地数据对FMS进行隐私性微调。对于FMS的联合微调,我们考虑具有最大数十亿个小型参数尺寸的FMS,最大为10亿个数字,被称为“ evice FMS(ODFM”),可以在设备上进行推理以进行推理,但只能通过参数有效方法进行微调。在我们的工作中,我们通过提出一种使用异质性低级别近似值(Loras)(即Het ...
知识图在众多人工智能任务中发挥着至关重要的作用,但它们经常面临不完整性的问题。在本研究中,我们探索利用大型语言模型(LLM)来完成知识图谱。我们将知识图中的三元组视为文本序列,并引入一种称为知识图谱LLM(KG-LLM)的创新框架来对这些三元组进行建模 ...
与标准动态范围(SDR)视频相比,高动态范围(HDR)视频可以代表更大的亮度和色彩,并且正迅速成为行业标准。与传统SDR视频相比,HDR视频具有更具挑战性的捕获,传输和显示要求。凭借其更大的深度,高级的电流传输功能以及更广泛的颜色范围,因此需要专门设计的视频质量算法,这些算法是专门设计的,以预测HDR视频的质量 ...
自动驾驶汽车安全对于成功部署自动驾驶汽车至关重要。但是,大多数现有的计划方法都严重依赖于模仿学习,这限制了他们有效利用碰撞数据的能力。此外,收集碰撞或近碰撞数据本质上是具有挑战性的,因为它涉及风险并引起道德和实际问题 ...
海洋科学深入研究了生命和生物多样性的海洋,鉴于海洋覆盖了我们星球表面的70%以上,它具有重要意义。最近,大型语言模型(LLM)的进步改变了科学的范式。尽管在其他领域取得了成功,但目前的LLM通常在满足海洋专家等领域的需求方面通常不足,而LLMS对海洋科学的潜力却没有探索 ...
现代文本到视频合成模型表明了从文本描述中表明复杂视频的连贯的,现实的生成。但是,大多数现有模型都缺乏对相机运动的细粒度控制,这对于与内容创建,视觉效果和3D视觉相关的下游应用程序至关重要。最近,新方法证明了使用可控摄像机生成视频的能力,使这些技术利用了预先训练的U-NET扩散模型,这些模型明确地分解了空间和时间生成 ...
在自然语言处理中,有效地处理长篇小说一直是一种持续的追求。随着越来越多的文档,对话和其他文本数据的数量,开发长上下文语言模型(LCLM)很重要,这些语言模型(LCLM)可以以有效而有效的方式处理和分析广泛的输入。在本文中,我们介绍了一项有关大语模型长篇小说建模的最新进展的综合调查 ...