尽管大型语言模型(LLM)在各个一般领域取得了显着进展,但在医学和医疗保健领域遇到了重大障碍。该领域面临着独特的挑战,例如特定领域的术语和对专业知识的推理。为了解决这些问题,我们为医学领域提出了一种新颖的多学科协作(MC)框架,该框架在角色扮演环境中利用基于 LLM 的代理参与多轮协作讨论,从而提高 LLM 的熟练程度和推理能力 ...
图形用户界面(GUI)代理已经成为人类计算机交互中的变革范式,从基于规则的自动化脚本到能够理解和执行复杂接口操作的复杂的AI驱动系统。这项调查提供了对基于LLM的GUI代理快速前进的领域的全面检查,系统地分析了其建筑基础,技术组成部分和评估方法。我们识别并分析了构成现代GUI代理的四个基本组件:(1)将基于文本的解析与多模式理解相结合的感知系统,以实现全面的界面理解; (2)通过内部建模,历史经验 ...
多模式大语言模型(MLLM)具有功率的图形用户界面(GUI)代理,在计算设备上自动化任务时有希望。最近的工作已经开始探索GUI任务中的推理,并令人鼓舞。但是,许多当前的方法依赖于手动设计的推理模板,这可能导致推理对复杂的GUI环境不足以适应和适应性 ...
车辆到所有(V2X)通信技术使车辆与附近环境中许多其他实体之间的协作可以从根本上改善自动驾驶的感知系统。但是,缺乏公共数据集大大限制了协作感知的研究进度。为了填补这一空白,我们提出了V2X-SIM,这是一个用于V2X辅助自动驾驶的全面模拟多代理感知数据集 ...
这项工作提出了一个大型语言模型(LLM)的代理商OpenFOAMGPT,专为以OpenFOAM为中心的计算流体动力学(CFD)仿真,利用OpenAI的两个基础模型:GPT-4O和一个The GPT-4O和一个想法(COT)(COT)(COT)可启用的O1预览模型。两种代理都表现出跨多个任务的成功。尽管使用O1模型的 Token 价格是GPT-4O的六倍,但它在处理复杂任务(从零击中设置到边界条件修 ...
在利用基础模型(例如大语言模型(LLM))来加速复杂的科学工作流程中,已经取得了重大进步。在这项工作中,我们介绍了Foampilot,这是一种概念验证LLM代理,旨在增强Firefoam的可用性,Firefoam是使用OpenFoam构建的专门用于火灾动力学和抑制火灾模拟的求解器,OpenFoam是一种流行的计算流体动力学开放式开放源工具盒(CFD)。 Foampilot提供了三个核心功能:代码洞 ...
时空数据面临着与自然语言文本的许多类似挑战,包括序列中的位置(单词),位置之间的长距离依赖性以及具有多种含义的位置。在这项工作中,我们提出了一个新型模型,用于代表高维时空轨迹作为离散位置的序列,并使用基于 Transformer 的神经网络结构对其进行编码。与语言模型类似,我们用于代理表示编码(Stare)模型的序列 Transformer 可以通过两个监督任务学习轨迹数据中的表示和结构(e .. ...
AI代理的目的是通过将基于文本的推理与外部工具调用相结合来解决复杂的任务。不幸的是,AI代理很容易受到促使注射攻击的攻击,在这些攻击中,外部工具返回的数据劫持了代理执行恶意任务。为了衡量AI代理的对抗性鲁棒性,我们介绍了AgentOjo,这是对代理的评估框架,该框架可以通过不受信任的数据执行工具 ...