我们介绍了代理推理,该框架通过整合使用外部工具的代理来增强大型语言模型(LLM)推理。与传统的基于LLM的推理方法不同,这些方法仅依赖于内部推理,代理推理动态参与Web搜索,代码执行和结构化的推理 - 上下文内存,以解决需要深入研究和多步逻辑扣除的复杂问题。我们的框架介绍了思维地图代理,该框架构建了一个结构化的知识图来跟踪逻辑关系,从而改善了演绎推理 ...
0 0 0 2025/05/21 arXiv:2502.04644v1 smarto
基于大语言模型(LLM)的智能代理系统在现实世界应用中显示出巨大的潜力。但是,现有的代理框架仍然面临任务计划和执行的关键限制,从而限制了其有效性和可推广性。具体而言,当前的计划方法通常缺乏明确的全球目标,导致代理人陷入本地分支机构或制定不可执行的计划 ...
0 0 0 2025/05/21 arXiv:2504.16563v3 Flyer-Jia
检索增强的生成(RAG)系统赋予大型语言模型(LLMS)在推理过程中访问外部知识。最近的进步使LLM能够通过增强学习(RL)充当搜索剂,从而通过与检索引擎进行多转交互通过多转交流来改善信息的获取。但是,现有方法要么使用仅搜索指标来优化检索(e ...
0 0 0 2025/05/21 arXiv:2505.14146v1 Flyer-Jia
大语言模型(LLM)中的React(推理 +动作)功能已成为现代代理系统的基础。最近的LLM,例如DeepSeek-R1和OpenAI O1/O3,通过通过产生充足的中间 Token 来强调推理来体现这一点,这有助于在产生最终产出 Token 之前建立强大的前提。在本文中,我们介绍了一种新颖的方法,一种新颖的方法,通过创建多步执行计划以及给定用户输入的详细推理来增强代理商的性能 ...
0 0 0 2025/05/21 arXiv:2505.09970v2 Flyer-Jia
语言模型(LMS)在各种任务中都达到了令人印象深刻的准确性,但仍然容易受到高信心错误的影响,也称为未知未知数(UUS)。这些UUS群集成为特征空间中的盲点,从而在高风险应用中带来了重大风险。这与更容易受到此类错误的较小,轻质的LMS尤其重要 ...
0 0 0 2025/05/20 arXiv:2403.17860v3 liujiahao
对GUI代理的培训有效的视觉语言模型(VLM)通常依赖于大规模注释的数据集的监督微调(SFT),在该数据集中收集过程易于劳动且容易出错。在这项工作中,我们提出了一项自制的反动力学任务,以使VLM通过推断引起过渡的动作来从GUI过渡对学习。这项培训任务提供了两个优点:(1)它使VLM可以忽略与用户操作无关的变化(e ...
0 0 0 2025/05/20 arXiv:2505.12493v1 xjx0524
我们提出了运动脱机器,一种基于扩散的表示,用于在多个智能体上联合分布未来轨迹。这种表示有几个关键优势:首先,我们的模型学习高度多模态分布,可以捕获不同的未来结果。其次 ...
0 0 0 2025/05/20 arXiv:2306.03083v1 jerome.zhou
基于小组的增强学习(RL)的最新进展已在数学推理等单转任务中驱动了前沿模型(LLMS)。但是,它们对长跑LLM代理训练的可伸缩性仍然有限。与静态任务不同,代理环境的互动在许多步骤中展开,并且通常会产生稀疏或延迟的奖励,从而使各个步骤的信贷分配变得更加具有挑战性 ...
0 0 0 2025/05/20 arXiv:2505.10978v1 chrisxiong

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)