利用多模式的大语言模型(MLLM)创建具体的代理,为解决现实世界任务提供了有希望的途径。虽然以语言为中心的体现药物引起了很大的关注,但由于缺乏全面的评估框架,基于MLLM的体现药物仍未被忽视。为了弥合这一差距,我们引入了体现,这是一种广泛的基准测试,旨在评估视觉驱动的体现剂 ...
0 0 0 2025/02/25 arXiv:2502.09560v2 yzwang
大型语言模型(LLM)和大型视觉语言模型(LVLM)表现出了令人印象深刻的语言/视觉推理能力,这激发了针对目标应用程序(例如购物助理或AI软件工程师)建筑代理的最新趋势。最近,已经提出了许多数据科学基准来研究其在数据科学领域的性能。但是,与实际数据科学应用程序相比,由于其简化设置,现有的数据科学基准仍然缺乏 ...
0 0 0 2025/02/25 arXiv:2409.07703v2 aezro
了解人类的行为和社会是社会科学中的一个核心重点,生成的社会科学的兴起标志着范式的重大转变。通过利用自下而上的模拟,它可以用可扩展,可复制和系统的计算方法来代替昂贵和逻辑上挑战的传统实验,以研究复杂的社会动态。大型语言模型(LLM)的最新进展进一步改变了这一研究范式,从而创造了类似人类的生成社会代理人和社会现实的模拟 ...
0 2 0 2025/02/25 arXiv:2502.08691v1 luckystar1992
现有的LLM在各种NLP任务上表现出色,但仍然在复杂的现实世界任务中挣扎,甚至配备了COT和REACT等先进策略。在这项工作中,我们提出了共同框架,该框架将人类社会的等级规划和协作模式转移到了LLM系统。具体而言,我们的共同框架涉及两个代理:(1)全球计划代理,以理解问题范围,制定宏观级别的计划并向本地执行代理提供详细的子任务描述,该描述是全球计划的初步演绎 ...
0 0 0 2025/02/25 arXiv:2406.13381v1 keqi
无人机(UAVS)举例说明的低空迁移率已经引入了各个领域的变革性进步,例如运输,物流和农业。利用灵活的观点和快速的机动性,无人机扩展了传统系统的感知和动作能力,从而引起了学术界和行业的广泛关注。但是,当前的无人机操作主要取决于人类控制,在简单的情况下仅具有有限的自主权,并且缺乏更复杂的环境和任务所需的智能和适应性 ...
0 0 0 2025/02/24 arXiv:2501.02341v1 KingXHJ
大型语言模型(LLM)代理商在任务自动化和智能决策中表现出显着的功能,推动了诸如Langchain和Autogen等代理开发框架的广泛采用。但是,这些框架主要为开发人员提供广泛的技术专业知识的服务 - 考虑到只有0.03%的全球人口具有必要的编程技能,这一重大局限性 ...
0 0 0 2025/02/24 arXiv:2502.05957v2 leec
大型语言模型(LLM)的最新进展已使软件工程(SE)的协作人与许多专业相似。但是,尚未完全探索将LLM纳入定性数据分析中的潜在好处和含义。例如,对研究人员来说,手动进行定性数据分析可能是耗时,努力且容易出错的任务 ...
0 0 0 2025/02/24 arXiv:2402.01386v1 小砾往前冲
本文探讨了代理AI和Langgraph在推​​进机器翻译(MT)的自动化和有效性方面的变化作用。代理是旨在执行特定任务的模块化组件,例如在特定语言之间进行翻译,并分别使用TranslateEnagent,TranslateFrenchagent和TranslateJpagent(分别用于英语,法语和日语翻译)。这些代理利用大型语言模型(LLM)(例如GPT-4O)的强大语义能力来确保准确,上下文相 ...
0 0 0 2025/02/24 arXiv:2412.03801v1 tufeiyuancaier

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)