最近的代理框架和推理时间算法通常由于验证生成的计划或推理以及单个任务中实例的复杂性而遇到的复杂计划问题。这些任务的许多现有方法要么执行任务级验证,而无需考虑约束,要么应用推论时间算法而不适应实例级别的复杂性。为了解决这些局限性,我们提出了Plangen,这是一种模型不合时宜且易于扩展的代理框架,具有三个关键组件:约束,验证和选择剂 ...
0 0 0 2025/05/28 arXiv:2502.16111v1 lovebl2025
将代理AI集成到科学发现中标志着研究自动化的新领域。这些能够推理,计划和自主决策的AI系统正在改变科学家如何执行文献综述,产生假设,进行实验和分析结果。这项调查提供了针对科学发现,对现有系统和工具进行分类的代理AI的全面概述,并强调了化学,生物学和材料科学等领域的最新进展 ...
0 0 0 2025/05/28 arXiv:2503.08979v1 colin66
我们给出了一个基于模型的代理,该代理会根据其与环境的互动来构建代表其对世界的知识。世界模型试图解释其互动,同时也对自己可以获得的奖励感到乐观。我们将这种乐观主义定义为程序和计划者之间的逻辑约束 ...
0 0 0 2025/05/28 arXiv:2402.12275v3 parsifalster
大型语言模型(LLMS)在复杂的任务和交互式环境中表现出了令人印象深刻的功能,但它们的创造力仍然没有被忽视。本文使用游戏Balderdash介绍了一个模拟框架,以评估LLM的创造力和逻辑推理。在Balderdash中,玩家为晦涩的术语生成虚拟的定义,以欺骗他人,同时确定正确的定义 ...
0 0 0 2025/05/28 arXiv:2411.10422v1 tianxi.wan
由大型语言模型(LLM)提供动力的多代理AI系统越来越多地用于解决复杂的任务。但是,这些系统通常依赖于脆弱的,手动设计的提示和启发式方法,从而使优化变得困难。优化多代理系统的关键挑战是为专用代理购买合适的培训数据 ...
0 0 0 2025/05/28 arXiv:2502.04780v1 jiangtingyu
随着LLM作为代理的发展,人们对将多个代理连接到多代理系统以同时解决任务,重点关注其在任务分配和协调中的作用,这一越来越兴趣。本文探讨了LLM如何在多个代理中有效分配计算任务,考虑到成本,效率和性能等因素。在这项工作中,我们解决了关键问题,包括LLM作为编排者和计划者的有效性,并比较其在任务分配和协调方面的有效性 ...
0 0 0 2025/05/28 arXiv:2504.02051v2 jiangtingyu
培训大语言模型(LLM)作为交互式代理提出了独特的挑战,包括长马决策以及与随机环境反馈进行互动。尽管增强学习(RL)在静态任务方面取得了进展,但多转弯代理RL培训仍然没有得到充实。我们提出了Starpo(状态思维 - 奖励政策优化),一个轨迹级代理RL的一般框架,并引入了Ragen,Ragen是一种用于培训和评估LLM代理的模块化系统 ...
0 0 0 2025/05/28 arXiv:2504.20073v2 Leonliu022
多代理系统已成为一种有希望的方法,用于增强复杂问题解决中大语言模型的推理能力。但是,当前的MAS框架受到灵活性和可伸缩性差的限制,并具有欠发达的优化策略。为了应对这些挑战,我们提出了RESO,该RESO将任务图的生成与奖励驱动的两阶段代理选择过程集成在一起 ...
0 0 0 2025/05/28 arXiv:2503.02390v2 tufeiyuancaier

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)