利用多模式的大语言模型(MLLM)创建具体的代理,为解决现实世界任务提供了有希望的途径。虽然以语言为中心的体现药物引起了很大的关注,但由于缺乏全面的评估框架,基于MLLM的体现药物仍未被忽视。为了弥合这一差距,我们引入了体现,这是一种广泛的基准测试,旨在评估视觉驱动的体现剂 ...
大型语言模型(LLM)和大型视觉语言模型(LVLM)表现出了令人印象深刻的语言/视觉推理能力,这激发了针对目标应用程序(例如购物助理或AI软件工程师)建筑代理的最新趋势。最近,已经提出了许多数据科学基准来研究其在数据科学领域的性能。但是,与实际数据科学应用程序相比,由于其简化设置,现有的数据科学基准仍然缺乏 ...
了解人类的行为和社会是社会科学中的一个核心重点,生成的社会科学的兴起标志着范式的重大转变。通过利用自下而上的模拟,它可以用可扩展,可复制和系统的计算方法来代替昂贵和逻辑上挑战的传统实验,以研究复杂的社会动态。大型语言模型(LLM)的最新进展进一步改变了这一研究范式,从而创造了类似人类的生成社会代理人和社会现实的模拟 ...
现有的LLM在各种NLP任务上表现出色,但仍然在复杂的现实世界任务中挣扎,甚至配备了COT和REACT等先进策略。在这项工作中,我们提出了共同框架,该框架将人类社会的等级规划和协作模式转移到了LLM系统。具体而言,我们的共同框架涉及两个代理:(1)全球计划代理,以理解问题范围,制定宏观级别的计划并向本地执行代理提供详细的子任务描述,该描述是全球计划的初步演绎 ...
无人机(UAVS)举例说明的低空迁移率已经引入了各个领域的变革性进步,例如运输,物流和农业。利用灵活的观点和快速的机动性,无人机扩展了传统系统的感知和动作能力,从而引起了学术界和行业的广泛关注。但是,当前的无人机操作主要取决于人类控制,在简单的情况下仅具有有限的自主权,并且缺乏更复杂的环境和任务所需的智能和适应性 ...
大型语言模型(LLM)代理商在任务自动化和智能决策中表现出显着的功能,推动了诸如Langchain和Autogen等代理开发框架的广泛采用。但是,这些框架主要为开发人员提供广泛的技术专业知识的服务 - 考虑到只有0.03%的全球人口具有必要的编程技能,这一重大局限性 ...
大型语言模型(LLM)的最新进展已使软件工程(SE)的协作人与许多专业相似。但是,尚未完全探索将LLM纳入定性数据分析中的潜在好处和含义。例如,对研究人员来说,手动进行定性数据分析可能是耗时,努力且容易出错的任务 ...
本文探讨了代理AI和Langgraph在推进机器翻译(MT)的自动化和有效性方面的变化作用。代理是旨在执行特定任务的模块化组件,例如在特定语言之间进行翻译,并分别使用TranslateEnagent,TranslateFrenchagent和TranslateJpagent(分别用于英语,法语和日语翻译)。这些代理利用大型语言模型(LLM)(例如GPT-4O)的强大语义能力来确保准确,上下文相 ...