作为人类交流的关键能力之一,说服力引起了智能对话系统领域的研究人员的广泛关注。我们人类倾向于说服他人通过各种情况下的对话来改变自己的观点,态度或行为(例如 ...
0 0 0 2025/04/23 arXiv:2402.04631v1 zhulixianghuan
无人机(UAVS)举例说明的低空迁移率已经引入了各个领域的变革性进步,例如运输,物流和农业。利用灵活的观点和快速的机动性,无人机扩展了传统系统的感知和动作能力,从而引起了学术界和行业的广泛关注。但是,当前的无人机操作主要取决于人类控制,在简单的情况下仅具有有限的自主权,并且缺乏更复杂的环境和任务所需的智能和适应性 ...
0 0 0 2025/04/23 arXiv:2501.02341v2 darkarc
尽管大型语言模型(LLM)在各个一般领域取得了显着进展,但在医学和医疗保健领域遇到了重大障碍。该领域面临着独特的挑战,例如特定领域的术语和对专业知识的推理。为了解决这些问题,我们为医学领域提出了一种新颖的多学科协作(MC)框架,该框架在角色扮演环境中利用基于 LLM 的代理参与多轮协作讨论,从而提高 LLM 的熟练程度和推理能力 ...
0 0 0 2025/04/23 arXiv:2311.10537v4 yang1young
图形用户界面(GUI)代理已经成为人类计算机交互中的变革范式,从基于规则的自动化脚本到能够理解和执行复杂接口操作的复杂的AI驱动系统。这项调查提供了对基于LLM的GUI代理快速前进的领域的全面检查,系统地分析了其建筑基础,技术组成部分和评估方法。我们识别并分析了构成现代GUI代理的四个基本组件:(1)将基于文本的解析与多模式理解相结合的感知系统,以实现全面的界面理解; (2)通过内部建模,历史经验 ...
0 0 0 2025/04/23 arXiv:2504.13865v1 13366395289
多模式大语言模型(MLLM)具有功率的图形用户界面(GUI)代理,在计算设备上自动化任务时有希望。最近的工作已经开始探索GUI任务中的推理,并令人鼓舞。但是,许多当前的方法依赖于手动设计的推理模板,这可能导致推理对复杂的GUI环境不足以适应和适应性 ...
0 0 0 2025/04/23 arXiv:2504.14239v1 xjx0524
车辆到所有(V2X)通信技术使车辆与附近环境中许多其他实体之间的协作可以从根本上改善自动驾驶的感知系统。但是,缺乏公共数据集大大限制了协作感知的研究进度。为了填补这一空白,我们提出了V2X-SIM,这是一个用于V2X辅助自动驾驶的全面模拟多代理感知数据集 ...
0 0 0 2025/04/23 arXiv:2202.08449v2 bendick
这项工作提出了一个大型语言模型(LLM)的代理商OpenFOAMGPT,专为以OpenFOAM为中心的计算流体动力学(CFD)仿真,利用OpenAI的两个基础模型:GPT-4O和一个The GPT-4O和一个想法(COT)(COT)(COT)可启用的O1预览模型。两种代理都表现出跨多个任务的成功。尽管使用O1模型的 Token 价格是GPT-4O的六倍,但它在处理复杂任务(从零击中设置到边界条件修 ...
0 0 0 2025/04/23 arXiv:2501.06327v1 GiveYouAFIst
在利用基础模型(例如大语言模型(LLM))来加速复杂的科学工作流程中,已经取得了重大进步。在这项工作中,我们介绍了Foampilot,这是一种概念验证LLM代理,旨在增强Firefoam的可用性,Firefoam是使用OpenFoam构建的专门用于火灾动力学和抑制火灾模拟的求解器,OpenFoam是一种流行的计算流体动力学开放式开放源工具盒(CFD)。 Foampilot提供了三个核心功能:代码洞 ...
0 0 0 2025/04/22 arXiv:2412.17146v1 GiveYouAFIst

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)