一译 —— 文档和论文翻译、对照阅读、讨论和社区

CoSTA$\ast$: Cost-Sensitive Toolpath Agent for Multi-turn Image Editing

稳定扩散和Dalle-3等文本对图像模型仍在多转图像编辑方面难度。我们将这些任务分解为工具使用的代理工作流（路径），该任务通过AI的成本工具来解决一系列子任务。常规的搜索算法需要昂贵的探索才能找到工具路径 ...

0 0 1 2025/03/16 arXiv:2503.10613v1 nlp

AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation

Web刮擦是一种强大的技术，可从网站中提取数据，启用自动数据收集，增强数据分析功能并最大程度地减少手动数据输入工作。现有方法，基于包装纸的方法在面对新网站时具有有限的适应性和可伸缩性，而由大语言模型（LLMS）授权的语言代理在不同的网络环境中的可重复使用性较差。在这项工作中，我们介绍了使用LLMS生成Web刮刀的范式，并提出了AutoScraper，这是一个两阶段的框架，可以更有效地处理多样化和更 ...

0 0 0 2025/03/15 arXiv:2404.12753v2 jueli

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

与智能手机相比，在基于MLLM的GUI代理的领域中，PC方案不仅具有更复杂的交互环境，而且还涉及更复杂的Intra Intra Inter-App和Inter-App工作流程。为了解决这些问题，我们提出了一个名为PC-Agent的分层代理框架。具体而言，从感知的角度来看，我们设计了一个主动感知模块（APM），以克服当前MLLM在感知屏幕快照内容中的能力不足 ...

0 0 0 2025/03/14 arXiv:2502.14282v2 elastic

Large Language Model-based Human-Agent Collaboration for Complex Task Solving

在研究界的最新发展中，大语言模型（LLM）在创建完全自主的代理方面的整合引起了人们的重大兴趣。尽管如此，基于LLM的代理商在适应动态环境和充分满足人类需求时经常表现出显着的缺点。在这项工作中，我们介绍了基于LLM的人类代理协作，以进行复杂的任务解决，从而探索其协同潜力 ...

0 0 0 2025/03/14 arXiv:2402.12914v1 owenzds

ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning

关于大语模型推理（LLM）推理的最新研究试图通过整合元思维来进一步提高其性能 - 使模型能够监视，评估和控制其推理过程，以进行更自适应和有效的问题解决。但是，当前的单一代理工作缺乏用于获取元思维的专业设计，从而导致低功效。为了应对这一挑战，我们引入了增强的元思维代理（REMA），这是一个新颖的框架，利用多机构增强学习（MARL）来引起元思考的行为，鼓励LLMS思考思维 ...

0 0 0 2025/03/14 arXiv:2503.09501v1 格子

Generative Multi-Agent Collaboration in Embodied AI: A Systematic Review

体现的多代理系统（EMAS）引起了人们越来越多的关注，因为它们在物流和机器人技术等领域中应对复杂的现实世界挑战的潜力。基础模型的最新进展为能够富裕的沟通和适应性问题解决的生成代理铺平了道路。这项调查提供了对EMA如何从这些生成能力中受益的系统检查 ...

0 1 0 2025/03/14 arXiv:2502.11518v1 15904435063

GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training

具有可验证的结果奖励（RLVR）的强化学习有效地扩大了大语言模型（LLMS）中的思维链（COT）推理。然而，在训练视觉语言模型（VLM）中，其在视觉环境中针对目标的动作推理的功效较少。这项工作通过对复杂的纸牌游戏（例如24分）以及Alfworld的体现任务进行了广泛的实验来调查此问题 ...

0 0 0 2025/03/13 arXiv:2503.08525v1 Rainbow

REGENT: A Retrieval-Augmented Generalist Agent That Can Act In-Context in New Environments

建立可以快速适应新环境的通才代理商是在数字和现实世界中部署AI的关键挑战。扩展当前代理体系结构是建造通才代理的最有效方法吗？我们提出了一种新颖的方法，可以在相对较小的数据集上预先培训相对较小的策略，并通过内在的学习将其调整为看不见的环境，而无需进行任何填充。我们的关键想法是，检索为快速适应提供了强大的偏见 ...

0 0 0 2025/03/13 arXiv:2412.04759v2 Cantaloupe

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）