通过启用动态,多步电推理和信息检索,代理检索效果生成(RAG)系统可以增强大语言模型(LLMS)。但是,这些系统经常表现出次优的搜索行为,例如过度搜索(检索冗余信息)和搜索不足(未能检索必要的信息),这阻碍了效率和可靠性。这项工作正式定义并量化了这些行为,揭示了它们在多个QA数据集和代理抹布系统中的流行率(e ...
0 0 0 2025/05/30 arXiv:2505.17281v1 chrisxiong
大型语言模型(LLM)的搜索代理通过动态分解问题并通过交错的推理和检索来解决问题,在解决复杂的任务方面表现出显着的功能。但是,这种交错的范式引入了大量效率瓶颈。首先,我们观察到,高度准确和过度近似检索方法降低了系统效率:精确的搜索会引起大量的检索开销,而粗糙的检索需要在生成过程中进行其他推理步骤 ...
0 0 0 2025/05/30 arXiv:2505.12065v1 colin66
有效的社会智能模拟要求语言代理人动态调整推理深度,这在当前的研究中也很明显。现有方法要么缺乏这种推理能力,要么在所有情况下都统一地执行了长期的经过思考的推理,从而导致过度的 Token 使用和僵化的社交模拟。为了解决这个问题,我们提出了一个$ \ textbf {a} $ daptive $ \ textbf {m} $ ode $ \ textbf {l} $ renning($ \ textb ...
0 0 0 2025/05/30 arXiv:2505.02156v4 十七
使用外部工具增强大型语言模型 (LLM) 已成为一种扩展其实用性、使它们能够解决实际任务的有前途的方法。现有的工作通常为 LLM 作为工具使用者提供手动设计的工作流程,其中 LLM 以逐步的方式规划一系列工具,并顺序执行每个工具以获得中间结果,直到得出最终答案。然而,他们在现实场景中面临两个挑战:(1)手工控制流程通常是临时的,并且将 LLM 限制在本地规划; (2) LLM 被要求仅使用手动演示 ...
0 0 0 2025/05/30 arXiv:2405.16533v2 杨十七
这项研究对AI代理和代理AI进行了严格的区分,提供了结构化的概念分类法,应用映射和挑战分析,以阐明其不同的设计理念和能力。我们首先概述搜索策略和基础定义,将AI代理描述为由大语言模型(LLMS)和大型图像模型(LIM)驱动的模块化系统,用于狭窄,特定于任务的自动化。生成的AI被定位为前体,AI代理通过工具集成,及时的工程和推理增强来推进 ...
0 1 0 2025/05/29 arXiv:2505.10468v4 lb47719448
大型语言模型(LLMS)在解决跨不同领域的复杂任务方面表现出了巨大的潜力,通常通过采用遵循详细说明和操作序列的代理工作流程。但是,构建这些工作流程需要大量的人类努力,限制可伸缩性和可推广性。最近的研究试图自动化这些工作流的生成和优化,但是现有方法仍然依赖于初始手动设置,而无法实现完全自动化和有效的工作流程生成 ...
0 0 0 2025/05/29 arXiv:2410.10762v4 jueli
受大规模语言建模进度的启发,我们采用类似的方法来构建文本输出领域之外的单一通才代理。我们称为Gato的代理商是一种多模式,多任务,多任务的通才政策。具有相同权重的同一网络可以播放Atari,字幕图像,聊天,带有真正的机器人臂的堆栈块等等,根据其上下文决定是否输出文本,联合扭矩,按钮按下或其他 Token  ...
0 0 0 2025/05/29 arXiv:2205.06175v3 kkkk
大型语言模型(llm)的最新进展催生了能够执行复杂任务的智能代理。本文介绍了一种新颖的基于llm的多模式代理框架,旨在操作智能手机应用程序。我们的框架使代理能够通过简化的动作空间来操作智能手机应用程序,模仿类人交互,例如点击和滑动... ...
0 1 0 2025/05/29 arXiv:2312.13771v2 jevon

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)