大型语言模型(llm)促进了各种人工智能对话代理的开发,包括模仿不同角色和人类行为的角色扮演对话代理。虽然之前的研究主要集中在增强这些智能体的对话能力、特定角色的知识和风格属性上,但在评估他们的社交智力方面存在明显的差距。在本文中,我们介绍了社交板,这是第一个旨在系统评估角色扮演对话代理在个人和群体社交层面的社交性的基准... ...
人工智能支持的音乐处理是一个多元化的领域,包含数十种任务,从生成任务(例如音色合成)到理解任务(例如声音合成) ...
在交通模拟中生成真实且可控的代理行为对于自动驾驶车辆的开发至关重要。这个问题通常被表述为通过直接预测未来轨迹或通过逆最优控制推断成本函数来从现实世界驾驶数据中进行模仿学习(IL)。在本文中,我们在 IL 和基于扩散的生成建模之间建立了概念联系,并引入了一种新颖的框架多功能行为扩散(VBD)来模拟与多个交通参与者的交互场景 ...
当前的语言模型驱动的代理通常缺乏有效的用户参与机制,考虑到用户指令中常见的模糊性,这一点至关重要。尽管擅长制定策略和执行任务,但这些代理在寻求澄清和掌握准确的用户意图方面遇到了困难。为了弥补这一差距,我们引入了交互意图(,in3),这是一种新颖的基准,旨在通过显式查询检查用户的隐式意图... ...
当今的突出的大型语言模型(LLM)与过去的语言模型不仅在大小上不同,而且还通过自然语言和形式语言(代码)的组合进行了培训。作为人类和计算机之间的媒介,代码将高级目标转化为可执行步骤,具有标准语法,逻辑一致性,抽象和模块化。在本调查中,我们概述了将代码集成到LLMS的培训数据中的各种好处 ...
大型语言模型(LLMS)利用了经营链(COT)促使逐步理解的理由,从而提高了复杂任务的性能。尽管有好处,但香草床通常无法完全验证中间的推论,并可能产生误导性的解释。在这项工作中,我们提出了分层链(分层)提示,这是一个新颖的框架,将推理过程系统地将推理过程分为多层,每层都经过外部检查和可选的用户反馈 ...
对AI代理商的信任已经在文献中进行了广泛的研究,从而在我们对该领域的理解中取得了重大进步。但是,大语言模型(LLM)的快速进步以及基于LLM的AI代理框架的出现构成了新的挑战和进一步研究的机会。在过程自动化领域,新一代基于AI的代理已经出现,从而实现了复杂任务的执行 ...
解决复杂的推理任务可能涉及视觉理解,域知识检索,数值计算和多步推理。现有方法可以增强具有外部工具的大型语言模型(LLM),但仅限于专业域,有限的工具类型或需要其他培训数据。在本文中,我们介绍了Octotools,这是一种无训练,用户友好且易于扩展的开源代理框架,旨在解决各种领域的复杂推理 ...