可以使用在Internet规模数据(例如,图像标题)上预先预测的,可以使用现成的视觉语言模型来对导航代理的视觉观察进行接地语言 ...
幻觉已成为有效应用大语言模型(LLM)的重大障碍。在这项工作中,我们引入了一种新型的注意力引导自我反省(AGSER)方法,用于LLMS中的零发幻觉检测。 AGSER方法利用注意力贡献将输入查询分类为细心和非竞争性查询 ...
诸如诊断和治疗计划之类的医疗任务需要精确而复杂的推理,尤其是在至关重要的领域中。与数学推理不同,医学推理需要细致,可验证的思维过程,以确保可靠性和准确性。但是,缺乏明显的数据集,这些数据集提供了透明的,分步的推理来验证和增强AI模型的医学推理能力 ...
多视图对象跟踪(MVOT)为诸如遮挡和目标丢失等挑战提供了有希望的解决方案,这些解决方案在传统的单视图跟踪中很常见。但是,由于缺乏全面的多视图数据集和有效的跨视图集成方法,进度受到了限制。为了克服这些限制,我们编制了234K高质量注释的框架的多视图对象跟踪(MVTRACK)数据集,这些框架在各种场景中具有27个不同的对象 ...
大型语言模型(LLM)在各个领域都取得了巨大的成功,这得益于其存储知识的大量参数。然而, LLM 仍然面临几个关键问题,例如幻觉问题、知识更新问题以及缺乏特定领域的专业知识。检索增强生成(RAG)的出现,利用外部知识数据库来增强 LLM ,弥补了 LLM 的这些缺点 ...
具有可验证奖励(RLVR)的强化学习在增强大语模型(LLMS)的数学推理和编码性能方面取得了重大成功,尤其是当可以访问结构化参考答案以进行验证时。但是,它扩展到更宽,结构较少的域仍然没有探索。在这项工作中,我们调查了RLVR在各种现实世界中的有效性和可扩展性,包括医学,化学,心理学,经济学和教育,在这些领域中,结构化的参考答案通常不可用 ...
渴望激励人类与复杂世界自主互动。相反,当前的AI代理需要明确的任务规格,例如指令或奖励功能,这限制了其自主性和行为多样性。在本文中,我们介绍了一个欲望驱动的自主剂(D2A),该代理可以使大型语言模型(LLM)自主提出和选择任务,并通过满足其多维欲望而进行动机 ...
大型推理模型(LRMS)具有显着的推理能力,但主要依赖于参数知识,从而限制了事实准确性。尽管最近的作品配备了基于基于LRM的LRM的加强学习能力,但它们在推理方面遭受了过度思考和缺乏鲁棒性的困扰,从而降低了他们的有效性回答(QA)任务。为了解决这个问题,我们提出了Rearag,这是一种事实增强的推理模型,探讨了不同的查询而没有过多的迭代 ...
信息检索系统(IR)系统的传统评估通常非常昂贵,因为它需要人类专家的手动相关性注释。生成人工智能(特别是大型语言模型(LLM))的最新进展可以以相对较小的计算成本生成相关注释。可能,这可以减轻传统上与IR评估相关的成本,并适用于众多低资源应用程序 ...
从现实世界中获取的几何数据,例如2D深度图像,3D点云和4D动态点云,发现了广泛的应用程序,包括沉浸式远程敏感,自主驾驶,监视等 ...