由大语言模型(LLM)提供支持的社会代理人可以模拟人类的社会行为,但在处理复杂的社会对话方面缺乏。直接优先优化(DPO)已被证明有效地使LLM行为与各种代理任务中的人类偏好保持一致。但是,标准DPO仅关注单个转弯,这限制了其在多转变社交互动中的有效性 ...
0 0 0 2025/03/31 arXiv:2501.01821v2 Joyce0105
通过控制计算机执行人工任务的自主代理可以提高人类的生产力和应用程序的可访问性。然而,该领域的进展将由现实且可重复的基准驱动。我们展示了 AndroidWorld,这是一个功能齐全的 Android 环境,可为 20 个现实世界的 Android 应用程序中的 116 个编程任务工作流程提供奖励信号 ...
0 0 0 2025/03/31 arXiv:2405.14573v4 hzx719
在大语言模型(LLM)中检测幻觉对于它们在现实世界应用中的可靠部署仍然是一个至关重要的挑战。为了解决这个问题,我们介绍了自我检查,这是一个集成了三种不同代理的新型框架:符号代理,专业检测剂和上下文一致性代理。这些代理提供了一种强大的多维方法来检测幻觉 ...
0 0 0 2025/03/31 arXiv:2502.01812v1 15872922001
多模态大语言模型 (MLLM) 正在改变图形用户界面 (GUI) 代理的功能,促进其从受控模拟过渡到跨各种平台的复杂的现实应用程序。然而,这些代理的有效性取决于其接地能力的稳健性。当前的 GUI 代理主要使用基于文本的表示形式,例如 HTML 或可访问树,尽管它们很实用,但通常会引入噪音、不完整性并增加计算开销 ...
0 0 0 2025/03/30 arXiv:2410.05243v2 ReLU
本文调查了基于大语言模型(LLM)的代理商的开发(QA)。传统代理人面临重大局限性,包括大量数据要求和对新环境的概括。基于LLM的代理商通过利用LLM作为其核心推理引擎来应对这些挑战 ...
0 0 0 2025/03/30 arXiv:2503.19213v1 liuweitang
尽管许多现有的用于构建基础模型代理的方法依赖于人类演示的提示或微调,但它在动态环境(例如移动设备控制)中还不够 ...
0 0 0 2025/03/29 arXiv:2502.15760v1 dsqi
我们介绍开放的深度搜索(ODS),以缩小专有搜索AI解决方案之间的差距,例如《困惑的声纳推理》和OpenAI的GPT-4O搜索预览及其开源对应物。 ODS引入的主要创新是通过推理代理可以明智地使用Web搜索工具来回答查询的最新开源LLM的推理能力。具体而言,ODS由两个组件组成,这些组件与用户选择的基本LLM一起使用:打开搜索工具和打开推理代理 ...
0 0 0 2025/03/29 arXiv:2503.20201v1 liuweitang
智能代理商的时代来自我们,这是由大语言模型的革命进步驱动的。具有目标驱动行为和动态适应能力的大型语言模型(LLM)代理可能代表了人工通用智能的关键途径。该调查通过以方法论为中心的分类法,将建筑基础,协作机制和进化途径联系起来,系统地解构了LLM代理系统 ...
0 0 0 2025/03/28 arXiv:2503.21460v1 niuzai

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)