多机构系统(MAS)在执行复杂的任务方面表现出巨大的潜力,但是协调和安全仍然是重大挑战。多机构增强学习(MARL)为代理协作提供了有希望的框架,但它在处理复杂任务和设计奖励功能方面面临困难。大型语言模型(LLM)的引入为MAS带来了更强的推理和认知能力,但是现有的基于LLM的系统努力在动态环境中迅速而准确地做出响应 ...
0 1 0 2025/07/02 arXiv:2503.10049v1 psyduck1
基于LLM的多代理系统已经在解决复杂的,代理任务的能力方面具有出色的功能,从产生高质量的演示幻灯片到进行复杂的科学研究。同时,RL因其在增强剂智能方面的有效性而被广泛认可,但有限的研究研究了使用基础RL技术对喇嘛进行微调。此外,MARL方法在喇嘛上的直接应用引入了重大挑战,这是源于喇嘛固有的独特特征和机制 ...
0 0 0 2025/07/02 arXiv:2504.16129v3 psyduck1
利用多种大型语言模型(LLM)来构建协作性多代理工作流,这表明了巨大的潜力。但是,大多数以前的研究都侧重于促使开箱即用的LLM,依靠其与生俱来的合作能力,这可能无法改善LLMS的性能,如最近所示。在本文中,我们介绍了一种新的训练后范式Maporl(用于加强学习的合作LLM的多代理后培训),以明确引起协作行为,并进一步释放多代理LLM LLM框架的力量 ...
0 0 0 2025/07/02 arXiv:2502.18439v1 psyduck1
仿真虽然在准确复制现实世界系统方面有力,但由于其复杂性,非技术用户通常仍然无法访问。相反,大型语言模型(LLMS)提供了直观的,基于语言的互动,但可能缺乏可靠地模拟复杂现实世界动态所需的结构化的,因果理解。我们介绍了我们的模拟代理框架,这是一种整合模拟模型和LLM的优势的新方法 ...
0 0 0 2025/07/01 arXiv:2505.13761v2 盛大的2
大语言模型(LLM)的快速进步已引起了一种新类别的自主AI系统,称为深度研究(DR)代理。这些代理人旨在通过利用动态推理,自适应长期计划,多跳信息检索,迭代工具使用和生成结构化分析报告的结合来解决复杂的多转化信息研究任务。在本文中,我们对构成深层研究代理的基础技术和建筑组件进行了详细的分析 ...
0 0 0 2025/07/01 arXiv:2506.18096v1 18743622602
随着大型语言模型(LLM)从文本完成工具演变为在动态环境中运行的完全刚起步的代理,他们必须应对不断学习和保留长期知识的挑战。许多生物系统通过情节记忆来解决这些挑战,该记忆支持特定于实例的上下文的单次学习。受此启发,我们为LLM代理提供了一个情节记忆框架,以五个偶发记忆的关键属性为中心,这些记忆是基于自适应和上下文敏感行为的基础 ...
0 0 1 2025/06/30 arXiv:2502.06975v1 18601752667
强化学习(RL)对培训LLM代理人进行了巨大的希望,以处理需要与外部环境进行多步交互的复杂,面向目标的任务。但是,将RL应用于这些代理任务时,一个关键的挑战来自延迟的奖励:反馈信号通常仅在完成整个任务后才获得。这使得将延迟的奖励分配给早期行动是非平凡的,从而提供了有关环境限制和阻碍代理培训的足够指导 ...
0 0 0 2025/06/30 arXiv:2505.20732v1 wonders
本文介绍了我们对以视觉,虚拟或物理形式体现的AI代理的研究,使他们能够与用户及其环境进行交互。这些试剂包括虚拟化身,可穿戴设备和机器人,旨在感知,学习和行动在周围的环境中,这使其与人类的学习方式和与环境相比的方式更为相似。我们建议,世界模型的发展对于体现的AI代理的推理和计划是至关重要的,允许这些代理人理解和预测其环境,了解用户意图和社会环境,从而增强其自动执行复杂任务的能力 ...
0 0 0 2025/06/30 arXiv:2506.22355v1 18601752667

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)