一译 —— 文档和论文翻译、对照阅读、讨论和社区

Why Solving Multi-agent Path Finding with Large Language Model has not Succeeded Yet

由于大语言模型（LLM）等大型语言模型和GPT-4的成功造成的爆炸性影响，最近有大量的工作表明，基础模型可用于解决各种各样的任务。但是，有非常有限的工作可以分享有关多代理计划的见解。通过结合多机构协调和计划的难度，多代理计划与其他领域不同，并且很难利用外部工具来促进所需的推理 ...

0 0 0 2025/06/26 arXiv:2401.03630v2 user

EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents

体现人工智能（EAI）将高级AI模型集成到现实世界中的物理实体中。基础模型作为高级任务计划的EAI代理的“大脑”的出现显示出了令人鼓舞的结果。但是，这些代理在物理环境中的部署提出了重大的安全挑战 ...

0 0 0 2025/06/26 arXiv:2408.04449v5 18601752667

Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction

由于依赖文本表示，特定于平台的动作空间和有限的推理功能，自动化GUI任务仍然具有挑战性。我们介绍了Aguvis，这是一种基于统一的视力框架，用于直接在屏幕图像上运行的自主GUI代理，标准化了跨平台相互作用，并通过内部独白结合结构化推理。为了实现这一目标，我们构建了Aguvis数据收集，这是一个具有多模式接地和推理注释的大型数据集，并开发了两阶段的培训管道，将GUI接地与计划和推理分开 ...

0 0 0 2025/06/26 arXiv:2412.04454v2 月隐

ObjectNav Revisited: On Evaluation of Embodied Agents Navigating to Objects

我们重新审视对象目标导航（ObjectNAV）的问题。在其最简单的形式中，ObjectNav定义为在未探索的环境中指定的标签指定的对象的任务。特别是，该代理在随机位置初始化，并在环境中姿势，并要求找到对象类别的实例e ...

0 0 1 2025/06/26 arXiv:2006.13171v2 18601752667

OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation

大型语言模型（LLM）的多代理系统显示出自动化现实世界任务的希望，但由于其特定于领域的性质而努力转移跨域。当前的方法面临两个关键的缺点：当应用于新域时，它们需要完整的体系结构重新设计和对所有组件进行全面重新培训。我们介绍了劳动力，这是一种层次多代理框架，将战略规划从专业执行中解散到一个模块化体系结构，包括：（i）用于任务分解的域 - 无关计划者，（ii）子任务管理的协调员，以及（iii）具有特定特 ...

0 0 0 2025/06/26 arXiv:2505.23885v2 stephen_16

AGENTiGraph: An Interactive Knowledge Graph Platform for LLM-based Chatbots Utilizing Private Data

大型语言模型〜（LLM）在各种应用中都表现出了能力，但是面临诸如幻觉，有限的推理能力和事实矛盾之类的挑战，尤其是在处理复杂的，特定领域的任务（例如询问问题）（QA）（QA）时。尽管知识图〜（kgs）已被证明有助于减轻这些问题，但对LLM与背景KGS整合的研究仍然有限。特别是，尚未彻底探索用户可访问性和基础公斤的灵活性 ...

0 0 0 2025/06/26 arXiv:2410.11531v1 张大宝

RAISE: Reasoning Agent for Interactive SQL Exploration

大型语言模型（LLMS）的最新进展已推动了自然语言界面的研究到数据库。但是，大多数最先进的文本到SQL系统仍然取决于复杂的多阶段管道。这项工作提出了一个新型的代理框架，该框架可以在单个端到端组件中统一链接，查询生成和迭代精致 ...

0 0 0 2025/06/26 arXiv:2506.01273v1 zkq

AgentDropout: Dynamic Agent Elimination for Token-Efficient and High-Performance LLM-Based Multi-Agent Collaboration

基于大语言模型（LLM）的多机构系统（MAS）在解决问题解决方面具有巨大的潜力。但是，他们仍然面临低沟通效率和次优的任务绩效的重大挑战，这使得对代理商的沟通拓扑的仔细设计尤为重要。受到管理理论的启发，即经常会动态调整在高效团队中的角色，我们提出了代理商，该代理商通过优化通信图的邻接矩阵来识别冗余代理和跨不同通信的通信，并消除它们以提高 Token 效率和任务绩效 ...

0 0 0 2025/06/25 arXiv:2503.18891v1 1150501302

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）