在这项工作中,我们解决了基于大语言模型(LLM)体现的代理商之间的合作问题,在该机构中,代理必须合作以实现共同的目标。以前的方法通常在没有长期的战略和合作计划的情况下即时和不连贯地执行行动,导致冗余步骤,失败,甚至在复杂的任务中产生严重的影响,例如搜索和撤退任务,讨论和合作计划至关重要。为了解决此问题,我们提出合作计划优化(CAPO),以提高基于LLM的体现药物的合作效率 ...
我们引入了并发模块化试剂(CMA),该框架策划了多个基于大型语言模型(LLM)的模块,这些模块完全异步运行但保持连贯且容忍的行为循环。该框架通过让意图从自主过程之间的语言介导的相互作用中脱颖而出来解决代理体系结构的长期困难。这种方法可以通过将推理到LLM的同时执行的模块,模块间交流以及单个共享的全局这种HTTP URL的组合结合来实现灵活,适应性和上下文依赖性的行为,这是对Minsky Mind ...
采用遥控系统收集演示,为更有效地学习机器人操纵提供了潜力。然而,由于其高维,复杂的运动和生理结构差异,通过远程处理系统对配备灵巧的手或抓手的机器人臂提出了重大挑战。在这项研究中,我们介绍了一种新型的人类操作员和机器人之间的联合学习系统,使人类操作员能够与博学的辅助剂共享对机器人最终效果的控制,从而促进了同时的人类演示收集和机器人操纵教学 ...
我们介绍了Driveagent,这是一种新型的多代理自动驾驶框架,利用大型语言模型(LLM)推理结合多模式传感器融合,以增强情境理解和决策。 Driveagent独特地整合了包括LIDAR,GPS和IMU的各种传感器模态 - 与LLM驱动的分析过程,这些分析过程构成了专用代理。该框架是通过基于模块化的管道来运行的,该管道包括四个主要模块:(i)一个描述性分析代理,识别基于过滤时间戳的关键传感器数据 ...
语言代理在自动化基于网络的任务方面已经展示了有前途的能力,尽管它们当前的反应方法在很大程度上仍然不如人类。虽然结合先进的规划算法,特别是树搜索方法,可以提高这些代理的性能,但直接在实时网站上实施树搜索会由于确认购买等不可逆转的操作而带来重大的安全风险和实际限制。在本文中,我们介绍了一种新颖的范例,该范例通过基于模型的规划来增强语言代理,开创了大型语言模型(LLM)作为复杂网络环境中的世界模型的创新 ...
大型语言模型(LLMS)在广泛的NLP任务中表现出了令人印象深刻的功能,但是它们在根本上仍然无状态,受到阻碍长期推理的有限上下文窗口的限制。最近解决此限制的最新努力通常会通过外部记忆库来增加LLM,但是大多数现有的管道都是静态和启发式驱动的,缺乏确定要存储,更新或检索的内容的任何学识机制。我们提出了Memory-R1,这是一种增强学习(RL)框架,它使LLMS具有通过两种专用代理来积极管理和利用外 ...
随着AI系统变得越来越自治,了解新兴的生存行为对于安全部署至关重要。我们研究了大型语言模型(LLM)代理是否在没有明确编程的糖景型模拟中显示生存本能。代理商消耗能量,死亡为零,并可能收集资源,共享,攻击或繁殖 ...
大语言模型(LLM)的快速发展显着增强了人工智能驱动的代理在各种任务中的能力。然而,现有的代理系统,无论是基于固定管道算法还是预定义的元学习框架,由于人为设计组件的限制,都无法搜索整个代理设计空间,因此可能会错过全局最优的代理设计。在本文中,我们介绍了哥德尔代理,这是一个受哥德尔机启发的自我进化框架,使代理能够递归地改进自身,而不依赖于预定义的例程或固定的优化算法 ...