数字媒体中错误信息的快速扩散需要超越孤立的大语言模型(LLM)或基于AI代理的检测方法的解决方案。本文介绍了一个新型的多代理框架,该框架涵盖了完整的错误信息生命周期:分类,检测,校正和源验证,以提供更透明和可靠的结果。与单位代理或单层架构相反,我们的方法采用了五种专业代理:用于动态维护可信赖库库的索引代理,这是用于标记错误信息类型的分类器代理,一种基于证据的检索和基于证据的检索和排名的提取剂,一种 ...
0 0 0 2025/07/30 arXiv:2505.17511v1 Zero_Zh123
多代理协作增强了情报,监视和侦察(ISR)任务的情境意识。无人驾驶飞机(UAV)的临时网络允许实时数据共享,但是由于其分散性质,它们面临安全挑战,使其容易受到网络物理攻击的影响。本文使用隐藏的Markov模型(HMM)基于基于信任的传感器融合,用于基于信任的传感器融合,以分散的方式估算代理的可信度及其提供的信息 ...
0 0 0 2025/07/29 arXiv:2507.17875v1 linkgeigei
大型语言模型(LLM)在各个领域都取得了重大进展。但是,在多学科团队(MDT)医疗咨询中仍然存在挑战。当前的研究通过角色分配,任务分解和医疗经验的积累来增强推理 ...
0 0 0 2025/07/29 arXiv:2503.13856v1 mia_lu9510
最近基于 LLM 的文本到 SQL 方法通常会在“大型”数据库和需要多步骤推理的复杂用户问题上出现显着的性能下降。此外,大多数现有方法忽视了 LLM 利用外部工具和模型协作的重要意义。为了应对这些挑战,我们引入了 MAC-SQL,这是一种基于 LLM 的新型多智能体协作框架 ...
0 0 0 2025/07/29 arXiv:2312.11242v6 18916369915
从计划到客户服务,可以解决复杂的日常任务的AI代理的最新进展已使在现实世界中的部署,但它们的不安全行为的可能性需要严格的评估。尽管先前的基准测试试图评估代理安全性,但大多数基准都依靠模拟环境,狭窄的任务域或不切实际的工具抽象而失败。我们介绍了OpenAgentsAfety,这是一个全面的模块化框架,用于评估八个关键风险类别的代理行为 ...
0 0 0 2025/07/29 arXiv:2507.06134v1 jingxi
通过最少的人类干预来完成复杂的计算机任务的自主代理有可能改变人类计算机的相互作用,从而显着提高可访问性和生产力。但是,现有基准要么缺乏交互式环境,要么仅限于某些应用程序或域特有的环境,因此无法反映现实世界计算机使用的多样性和复杂性质,从而限制了任务范围和代理可扩展性的范围。为了解决此问题,我们介绍了OSWorld,这是针对多模式代理的首个可扩展的,真实的计算机环境,支持任务设置,基于执行的评估以及 ...
0 0 0 2025/07/29 arXiv:2404.07972v2 momoom
电信网络中的根本原因分析(RCA)是一项关键任务,但由于其复杂的基于图的推理要求和现实基准的稀缺性,它对人工智能(AI)提出了巨大的挑战 ...
0 0 0 2025/07/29 arXiv:2507.18190v1 waterfall666
从类似形式的文档(例如发票,采购订单,账单和财务文件)中提取字母数字数据,通常是通过视觉(OCR)和学习算法或整体管道来执行的,具有系统性改进的潜力。我们提出了一个代理AI系统,该系统利用大型语言模型(LLM)代理和强化学习(RL)驱动器代理来自动化一致,在LLM推理不确定性下进行自我改善提取。我们的工作突出了基于LLM的提取的局限性,并引入了一个模块化的多代理框架,该框架具有特定于任务的提示以及 ...
0 0 1 2025/07/28 arXiv:2505.13504v1 zmlcc

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)