在大语言模型(LLM)中检测幻觉对于它们在现实世界应用中的可靠部署仍然是一个至关重要的挑战。为了解决这个问题,我们介绍了自我检查,这是一个集成了三种不同代理的新型框架:符号代理,专业检测剂和上下文一致性代理。这些代理提供了一种强大的多维方法来检测幻觉 ...
多模态大语言模型 (MLLM) 正在改变图形用户界面 (GUI) 代理的功能,促进其从受控模拟过渡到跨各种平台的复杂的现实应用程序。然而,这些代理的有效性取决于其接地能力的稳健性。当前的 GUI 代理主要使用基于文本的表示形式,例如 HTML 或可访问树,尽管它们很实用,但通常会引入噪音、不完整性并增加计算开销 ...
本文调查了基于大语言模型(LLM)的代理商的开发(QA)。传统代理人面临重大局限性,包括大量数据要求和对新环境的概括。基于LLM的代理商通过利用LLM作为其核心推理引擎来应对这些挑战 ...
尽管许多现有的用于构建基础模型代理的方法依赖于人类演示的提示或微调,但它在动态环境(例如移动设备控制)中还不够 ...
我们介绍开放的深度搜索(ODS),以缩小专有搜索AI解决方案之间的差距,例如《困惑的声纳推理》和OpenAI的GPT-4O搜索预览及其开源对应物。 ODS引入的主要创新是通过推理代理可以明智地使用Web搜索工具来回答查询的最新开源LLM的推理能力。具体而言,ODS由两个组件组成,这些组件与用户选择的基本LLM一起使用:打开搜索工具和打开推理代理 ...
智能代理商的时代来自我们,这是由大语言模型的革命进步驱动的。具有目标驱动行为和动态适应能力的大型语言模型(LLM)代理可能代表了人工通用智能的关键途径。该调查通过以方法论为中心的分类法,将建筑基础,协作机制和进化途径联系起来,系统地解构了LLM代理系统 ...
GUI 长期以来一直是人机交互的核心,提供了一种直观且视觉驱动的方式来访问数字系统并与之交互。 LLM ,特别是多模式模型的出现,开创了 GUI 自动化的新时代。他们在自然语言理解、代码生成和视觉处理方面表现出了卓越的能力 ...
我们提出了锤打(分层抹布增强的医学测试建议),这是一种新颖的树结构推荐系统,利用检索效果的生成(RAG)进行智能医疗测试建议。与传统的基于矢量相似性的方法不同,我们的系统通过专门的抹布过程在每个树节点上执行医学推理。从具有初始症状的根节点开始,该系统将进行逐步的医学分析,以识别潜在的潜在条件及其相应的诊断要求 ...