一译 —— 文档和论文翻译、对照阅读、讨论和社区

EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents

利用多模式的大语言模型（MLLM）创建具体的代理，为解决现实世界任务提供了有希望的途径。虽然以语言为中心的体现药物引起了很大的关注，但由于缺乏全面的评估框架，基于MLLM的体现药物仍未被忽视。为了弥合这一差距，我们引入了体现，这是一种广泛的基准测试，旨在评估视觉驱动的体现剂 ...

0 0 0 2025/02/25 arXiv:2502.09560v2 yzwang

DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?

大型语言模型（LLM）和大型视觉语言模型（LVLM）表现出了令人印象深刻的语言/视觉推理能力，这激发了针对目标应用程序（例如购物助理或AI软件工程师）建筑代理的最新趋势。最近，已经提出了许多数据科学基准来研究其在数据科学领域的性能。但是，与实际数据科学应用程序相比，由于其简化设置，现有的数据科学基准仍然缺乏 ...

0 0 0 2025/02/25 arXiv:2409.07703v2 aezro

AgentSociety: Large-Scale Simulation of LLM-Driven Generative Agents Advances Understanding of Human Behaviors and Society

了解人类的行为和社会是社会科学中的一个核心重点，生成的社会科学的兴起标志着范式的重大转变。通过利用自下而上的模拟，它可以用可扩展，可复制和系统的计算方法来代替昂贵和逻辑上挑战的传统实验，以研究复杂的社会动态。大型语言模型（LLM）的最新进展进一步改变了这一研究范式，从而创造了类似人类的生成社会代理人和社会现实的模拟 ...

0 2 0 2025/02/25 arXiv:2502.08691v1 luckystar1992

CoAct: A Global-Local Hierarchy for Autonomous Agent Collaboration

现有的LLM在各种NLP任务上表现出色，但仍然在复杂的现实世界任务中挣扎，甚至配备了COT和REACT等先进策略。在这项工作中，我们提出了共同框架，该框架将人类社会的等级规划和协作模式转移到了LLM系统。具体而言，我们的共同框架涉及两个代理：（1）全球计划代理，以理解问题范围，制定宏观级别的计划并向本地执行代理提供详细的子任务描述，该描述是全球计划的初步演绎 ...

0 0 0 2025/02/25 arXiv:2406.13381v1 keqi

UAVs Meet LLMs: Overviews and Perspectives Toward Agentic Low-Altitude Mobility

无人机（UAVS）举例说明的低空迁移率已经引入了各个领域的变革性进步，例如运输，物流和农业。利用灵活的观点和快速的机动性，无人机扩展了传统系统的感知和动作能力，从而引起了学术界和行业的广泛关注。但是，当前的无人机操作主要取决于人类控制，在简单的情况下仅具有有限的自主权，并且缺乏更复杂的环境和任务所需的智能和适应性 ...

0 0 0 2025/02/24 arXiv:2501.02341v1 KingXHJ

AutoAgent: A Fully-Automated and Zero-Code Framework for LLM Agents

大型语言模型（LLM）代理商在任务自动化和智能决策中表现出显着的功能，推动了诸如Langchain和Autogen等代理开发框架的广泛采用。但是，这些框架主要为开发人员提供广泛的技术专业知识的服务 - 考虑到只有0.03％的全球人口具有必要的编程技能，这一重大局限性 ...

0 0 0 2025/02/24 arXiv:2502.05957v2 leec

Can Large Language Models Serve as Data Analysts? A Multi-Agent Assisted Approach for Qualitative Data Analysis

大型语言模型（LLM）的最新进展已使软件工程（SE）的协作人与许多专业相似。但是，尚未完全探索将LLM纳入定性数据分析中的潜在好处和含义。例如，对研究人员来说，手动进行定性数据分析可能是耗时，努力且容易出错的任务 ...

0 0 0 2025/02/24 arXiv:2402.01386v1 小砾往前冲

Agent AI with LangGraph: A Modular Framework for Enhancing Machine Translation Using Large Language Models

本文探讨了代理AI和Langgraph在推进机器翻译（MT）的自动化和有效性方面的变化作用。代理是旨在执行特定任务的模块化组件，例如在特定语言之间进行翻译，并分别使用TranslateEnagent，TranslateFrenchagent和TranslateJpagent（分别用于英语，法语和日语翻译）。这些代理利用大型语言模型（LLM）（例如GPT-4O）的强大语义能力来确保准确，上下文相 ...

0 0 0 2025/02/24 arXiv:2412.03801v1 tufeiyuancaier

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）