我们提出生成增强检索(GAR)来回答开放域问题,它通过启发式发现的相关上下文的文本生成来增强查询,而无需外部资源作为监督。我们证明,生成的上下文极大地丰富了查询的语义,并且具有稀疏表示的 GAR (BM25) 实现了与 DPR 等最先进的密集检索方法相当或更好的性能。我们表明,为查询生成不同的上下文是有益的,因为融合它们的结果始终会产生更好的检索准确性 ...
大型语言模型可以编码有关世界的丰富语义知识。这些知识旨在执行以自然语言表达的高级、时间扩展指令的机器人来说非常有用。然而,语言模型的一个显着缺陷是它们缺乏现实世界的经验,这使得很难给出确定的实施例,利用它们进行决策...... ...
大型语言模型已被证明可以使用少样本学习在各种自然语言任务中实现卓越的性能,这大大减少了使模型适应特定应用程序所需的特定于任务的训练示例的数量。为了进一步了解规模对小样本学习的影响,我们训练了一个包含 5400 亿个参数的密集激活 Transformer 语言模型,我们将其称为 Pathways 语言模型 PaLM。我们使用 Pathways 在 6144 TPU v4 芯片上训练 PaLM,Pathways 是一种新的 ML 系统,可以跨多个 TPU Pod 进行高效训练 ...
大型语言模型(LLM)已经表现出卓越的零样本泛化能力:最先进的聊天机器人可以为日常生活中出现的许多常见问题提供合理的答案。然而,无论如何,LLM无法可靠地长期解决相比之下,经典规划者一旦以格式化方式给出问题,就可以使用高效的搜索算法来快速识别正确的甚至最优的计划... ...
我们能否在历史上的十字路口避免战争?整个人类历史上的个人、学者、政策制定者和组织一直在追寻这个问题。在这项研究中,我们尝试根据人工智能(AI)和大型语言模型(我们提出\textbf{WarAgent},一个由LLM驱动的多智能体人工智能系统,用于模拟历史性国际冲突中涉及国家、他们的决策和后果,包括第一次世界大战(WWI)、惨烈()和中国古代的战国时期(WSP) ... ...
大型语言模型 (LLM) 的出现极大地影响了自然语言处理,在各种任务中展示了卓越的结果。在这项研究中,我们采用“内省技巧”来帮助 LLM 自我优化他们的决策。通过内省检查轨迹, LLM 通过生成简洁而有价值的技巧来完善其政策 ...
自主系统很快将无处不在,从制造自主权到农田机器人,从医疗保健助理到娱乐业。这些系统中的大多数都是使用模块化子组件开发的,用于手工设计或基于学习的决策、规划和控制。虽然这些现有方法已被证明在专门设计的情况下表现良好,但在测试时无疑会出现的罕见、不符合分布的情况下,它们的表现尤其差 ...
人类通过多模态反馈学习、概括和控制复杂操作任务的能力表明了一种独特的能力,我们将其称为灵巧智能。理解和评估这种情报是一项复杂的任务。随着大语言模型(LLM)的快速发展和广泛普及,它们在机器人领域的应用越来越受到关注 ...
大型语言模型(LLM)的最新进展,特别是思维链提示的发明,使得通过逐步推理自动回答问题成为可能。然而,当面对需要非线性思维的更复杂的问题时,即使是最强大的 LLM 也会犯错误。为了解决这个问题,我们探讨了 LLM 是否能够在自己的逐步推理中识别错误,而无需求助于外部资源 ...