一译 —— 文档和论文翻译、对照阅读、讨论和社区

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

与智能手机相比，在基于MLLM的GUI代理的领域中，PC方案不仅具有更复杂的交互环境，而且还涉及更复杂的Intra Intra Inter-App和Inter-App工作流程。为了解决这些问题，我们提出了一个名为PC-Agent的分层代理框架。具体而言，从感知的角度来看，我们设计了一个主动感知模块（APM），以克服当前MLLM在感知屏幕快照内容中的能力不足 ...

0 0 0 2025/03/14 arXiv:2502.14282v2 elastic

Large Language Model-based Human-Agent Collaboration for Complex Task Solving

在研究界的最新发展中，大语言模型（LLM）在创建完全自主的代理方面的整合引起了人们的重大兴趣。尽管如此，基于LLM的代理商在适应动态环境和充分满足人类需求时经常表现出显着的缺点。在这项工作中，我们介绍了基于LLM的人类代理协作，以进行复杂的任务解决，从而探索其协同潜力 ...

0 0 0 2025/03/14 arXiv:2402.12914v1 owenzds

ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning

关于大语模型推理（LLM）推理的最新研究试图通过整合元思维来进一步提高其性能 - 使模型能够监视，评估和控制其推理过程，以进行更自适应和有效的问题解决。但是，当前的单一代理工作缺乏用于获取元思维的专业设计，从而导致低功效。为了应对这一挑战，我们引入了增强的元思维代理（REMA），这是一个新颖的框架，利用多机构增强学习（MARL）来引起元思考的行为，鼓励LLMS思考思维 ...

0 0 0 2025/03/14 arXiv:2503.09501v1 格子

Generative Multi-Agent Collaboration in Embodied AI: A Systematic Review

体现的多代理系统（EMAS）引起了人们越来越多的关注，因为它们在物流和机器人技术等领域中应对复杂的现实世界挑战的潜力。基础模型的最新进展为能够富裕的沟通和适应性问题解决的生成代理铺平了道路。这项调查提供了对EMA如何从这些生成能力中受益的系统检查 ...

0 1 0 2025/03/14 arXiv:2502.11518v1 15904435063

GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training

具有可验证的结果奖励（RLVR）的强化学习有效地扩大了大语言模型（LLMS）中的思维链（COT）推理。然而，在训练视觉语言模型（VLM）中，其在视觉环境中针对目标的动作推理的功效较少。这项工作通过对复杂的纸牌游戏（例如24分）以及Alfworld的体现任务进行了广泛的实验来调查此问题 ...

0 0 0 2025/03/13 arXiv:2503.08525v1 Rainbow

REGENT: A Retrieval-Augmented Generalist Agent That Can Act In-Context in New Environments

建立可以快速适应新环境的通才代理商是在数字和现实世界中部署AI的关键挑战。扩展当前代理体系结构是建造通才代理的最有效方法吗？我们提出了一种新颖的方法，可以在相对较小的数据集上预先培训相对较小的策略，并通过内在的学习将其调整为看不见的环境，而无需进行任何填充。我们的关键想法是，检索为快速适应提供了强大的偏见 ...

0 0 0 2025/03/13 arXiv:2412.04759v2 Cantaloupe

LLM-Powered Multi-Agent System for Automated Crypto Portfolio Management

与传统资产相比，加密货币投资本质上很困难，需要整合来自各种方式的大量数据以及对复杂推理的需求。尽管已经采用了深度学习方法来应对这些挑战，但它们的黑盒本质引起了人们对信任和解释性的关注。最近，大型语言模型（LLMS）由于能够理解多模式数据并产生可解释的决策，因此在财务应用中显示了希望 ...

0 0 0 2025/03/13 arXiv:2501.00826v2 75916747

Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning

尽管大语言模型（LLM）在各种推理任务中具有显着的功能，但它们仍然在表格推理任务上挣扎，尤其是在整个多步推理过程中保持一致性时。尽管现有方法探讨了各种分解策略，但它们通常缺乏有效的机制来识别和纠正中间推理步骤中的错误，从而导致级联错误传播。为了解决这些问题，我们提出了Table-Critic，这是一个新型的多代理框架，促进了对推理过程的协作批评和迭代性的完善，直到融合纠正解决方案为止 ...

0 0 0 2025/03/13 arXiv:2502.11799v1 格子

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）