一译 —— 文档和论文翻译、对照阅读、讨论和社区

RAISE: Reasoning Agent for Interactive SQL Exploration

大型语言模型（LLMS）的最新进展已推动了自然语言界面的研究到数据库。但是，大多数最先进的文本到SQL系统仍然取决于复杂的多阶段管道。这项工作提出了一个新型的代理框架，该框架可以在单个端到端组件中统一链接，查询生成和迭代精致 ...

0 0 0 2025/06/26 arXiv:2506.01273v1 zkq

AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration

基于大语言模型（LLM）的多机构系统（MAS）在解决问题解决方面具有巨大的潜力。但是，他们仍然面临低沟通效率和次优的任务绩效的重大挑战，这使得对代理商的沟通拓扑的仔细设计尤为重要。受到管理理论的启发，即经常会动态调整在高效团队中的角色，我们提出了代理商，该代理商通过优化通信图的邻接矩阵来识别冗余代理和跨不同通信的通信，并消除它们以提高 Token 效率和任务绩效 ...

0 0 0 2025/06/25 arXiv:2503.18891v1 1150501302

Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems

大型基于语言模型的多代理系统最近由于其对复杂，协作和智能解决问题的能力的潜力而受到了极大的关注。现有的调查通常根据其应用域或架构对基于LLM的多代理系统（LLM-MAS）进行分类，从而忽略了通信在协调代理行为和交互中的核心作用。为了解决这一差距，本文从以沟通为中心的角度介绍了对LLM-MA的全面调查 ...

0 0 0 2025/06/25 arXiv:2502.14321v2 1150501302

FLAG-Trader: Fusion LLM-Agent with Gradient-based Reinforcement Learning for Financial Trading

对多模式财务数据进行了微调的大型语言模型（LLMS）在各种财务任务中表现出令人印象深刻的推理能力。但是，他们经常在交易式金融市场（例如交易）中与多步，面向目标的方案斗争，在这种情况下，需要复杂的代理方法来改善决策。为了解决这个问题，我们建议\ textsc {flag-trader}，这是一种统一的体系结构，将语言处理（通过LLMS）与梯度驱动的加固学习（RL）策略优化集成在一起，其中部分微调的L ...

0 0 0 2025/06/25 arXiv:2502.11433v3 yang1young

FinCon: A Synthesized LLM Multi-Agent System with Conceptual Verbal Reinforcement for Enhanced Financial Decision Making

大型语言模型（LLM）在执行复杂的任务方面具有显着潜力，并越来越多地用于各种财务应用中。但是，高质量的顺序金融投资决策仍然具有挑战性。这些任务需要在每个决定中都与动荡的环境进行多次互动，要求足够的情报以最大化回报并管理风险 ...

0 0 0 2025/06/25 arXiv:2407.06567v3 yang1young

MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching

指导微调在NLP任务中至关重要，从而增强了预验证的模型跟踪功能和特定于任务的性能。但是，由于数据收集困难和高生产成本，获得大型模型的高质量微调数据是具有挑战性的。为了解决这个问题，我们提出了一种新的数据增强方法，该方法通过具有不同认知水平的多个代理之间的相互作用来丰富原始数据 ...

0 0 0 2025/06/25 arXiv:2506.02689v2 firefly2024

MCP-Zero: Active Tool Discovery for Autonomous LLM Agents

函数呼叫使大型语言模型（LLMS）能够充当使用工具的代理，但是将数千个工具模式注入提示是昂贵且容易出错的。我们介绍了MCP-Zero，这是一种主动的代理框架，使LLM本身可以决定何时以及要检索哪些外部工具，从而从头开始组装特定于任务的工具链。该框架建立在三个组件上：（1）主动工具请求，该模型在其中排放了结构化的$ \ left <\ operatatorName {tool \ _ assista ...

0 0 0 2025/06/25 arXiv:2506.01056v4 JayLiu

Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making

我们旨在评估大型语言模型（LLMS）进行具体决策。尽管大量的工作一直在利用LLM在具体的环境中进行决策，但我们仍然缺乏对其性能的系统性理解，因为它们通常用于不同的域，用于不同的目的，并基于不同的输入和输出而构建。此外，现有的评估倾向于仅依赖最终的成功率，因此很难确定LLM中缺少什么能力以及问题所在的地方，而问题又可以有效，有效地利用LLMS体现的代理 ...

0 0 0 2025/06/25 arXiv:2410.07166v3 mencius

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）