一译 —— 文档和论文翻译、对照阅读、讨论和社区

SocialBench: Sociality Evaluation of Role-Playing Conversational Agents

大型语言模型（llm）促进了各种人工智能对话代理的开发，包括模仿不同角色和人类行为的角色扮演对话代理。虽然之前的研究主要集中在增强这些智能体的对话能力、特定角色的知识和风格属性上，但在评估他们的社交智力方面存在明显的差距。在本文中，我们介绍了社交板，这是第一个旨在系统评估角色扮演对话代理在个人和群体社交层面的社交性的基准... ...

0 0 0 2025/02/22 arXiv:2403.13679v4 billlight114

MusicAgent: An AI Agent for Music Understanding and Generation with Large Language Models

人工智能支持的音乐处理是一个多元化的领域，包含数十种任务，从生成任务（例如音色合成）到理解任务（例如声音合成） ...

0 0 0 2025/02/22 arXiv:2310.11954v2 15370090936

Versatile Behavior Diffusion for Generalized Traffic Agent Simulation

在交通模拟中生成真实且可控的代理行为对于自动驾驶车辆的开发至关重要。这个问题通常被表述为通过直接预测未来轨迹或通过逆最优控制推断成本函数来从现实世界驾驶数据中进行模仿学习（IL）。在本文中，我们在 IL 和基于扩散的生成建模之间建立了概念联系，并引入了一种新颖的框架多功能行为扩散（VBD）来模拟与多个交通参与者的交互场景 ...

0 0 0 2025/02/22 arXiv:2404.02524v2 布朗瓶

Tell Me More! Towards Implicit User Intention Understanding of Language Model Driven Agents

当前的语言模型驱动的代理通常缺乏有效的用户参与机制，考虑到用户指令中常见的模糊性，这一点至关重要。尽管擅长制定策略和执行任务，但这些代理在寻求澄清和掌握准确的用户意图方面遇到了困难。为了弥补这一差距，我们引入了交互意图（，in3），这是一种新颖的基准，旨在通过显式查询检查用户的隐式意图... ...

0 0 0 2025/02/22 arXiv:2402.09205v2 fenghuizi

If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code Empowers Large Language Models to Serve as Intelligent Agents

当今的突出的大型语言模型（LLM）与过去的语言模型不仅在大小上不同，而且还通过自然语言和形式语言（代码）的组合进行了培训。作为人类和计算机之间的媒介，代码将高级目标转化为可执行步骤，具有标准语法，逻辑一致性，抽象和模块化。在本调查中，我们概述了将代码集成到LLMS的培训数据中的各种好处 ...

0 0 0 2025/02/21 arXiv:2401.00812v2 15370090936

Layered Chain-of-Thought Prompting for Multi-Agent LLM Systems: A Comprehensive Approach to Explainable Large Language Models

大型语言模型（LLMS）利用了经营链（COT）促使逐步理解的理由，从而提高了复杂任务的性能。尽管有好处，但香草床通常无法完全验证中间的推论，并可能产生误导性的解释。在这项工作中，我们提出了分层链（分层）提示，这是一个新颖的框架，将推理过程系统地将推理过程分为多层，每层都经过外部检查和可选的用户反馈 ...

0 0 0 2025/02/20 arXiv:2501.18645v2 Merlin_Wong

Enhancing Trust in LLM-Based AI Automation Agents: New Considerations and Future Challenges

对AI代理商的信任已经在文献中进行了广泛的研究，从而在我们对该领域的理解中取得了重大进步。但是，大语言模型（LLM）的快速进步以及基于LLM的AI代理框架的出现构成了新的挑战和进一步研究的机会。在过程自动化领域，新一代基于AI的代理已经出现，从而实现了复杂任务的执行 ...

0 0 0 2025/02/20 arXiv:2308.05391v1 hzz137

OctoTools: An Agentic Framework with Extensible Tools for Complex Reasoning

解决复杂的推理任务可能涉及视觉理解，域知识检索，数值计算和多步推理。现有方法可以增强具有外部工具的大型语言模型（LLM），但仅限于专业域，有限的工具类型或需要其他培训数据。在本文中，我们介绍了Octotools，这是一种无训练，用户友好且易于扩展的开源代理框架，旨在解决各种领域的复杂推理 ...

0 0 0 2025/02/20 arXiv:2502.11271v1 liuweitang

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）