多代理系统协调基于LLM的代理,以代表用户执行任务。在实际应用程序中,多代理系统将不可避免地与不受信任的输入(例如恶意的Web内容,文件,电子邮件附件等)进行交互。使用最近提出的一些多代理框架作为具体示例,我们证明了对抗内容可以在系统中抢劫和通信以调用不安全的媒介和功能性 ...
代理AI系统建立在大型语言模型(LLMS)上并通过多代理配置部署,正在重新定义跨企业和社会领域的智能自主权,协作和决策。本综述在基于LLM的代理多代理系统(AMA)的背景下对信任,风险和安全管理(TRISM)进行了结构化分析。首先,我们研究了代理AI的概念基础,其与传统AI代理的架构差异以及实现可扩展,使用工具自主权的新兴系统设计 ...
大型语言模型(LLM)在各种任务中的出色表现带来了许多机会以及在生产环境中利用它们的挑战。为了实际采用LLM,多代理系统在更大的企业平台的较大背景下使用现有专有数据和模型来处理复杂的现实世界任务。尽管这些系统取得了巨大的成功,但当前的方法仍依靠狭窄的单一对象目标来优化和评估,通常会忽略实际情况下的潜在限制,包括预算,资源和时间 ...
搜索引擎至关重要,因为它们提供了一种有效且简单的方法来访问互联网上的大量信息,以满足不同的信息需求。用户查询,即使有特定的需求,也可能有很大差异。先前的研究已经探索了排名模型针对典型查询变化(如释义、拼写错误和顺序更改) ...
评估大型语言模型(LLM)对人类的理解,而不仅仅是文本,这仍然是一个开放的挑战。为了弥合差距,我们引入了有声学代理作为法官(SAGE),这是一个自动化评估框架,可衡量LLM的高阶社交认知。 Sage实例化了一种有知觉的代理,该代理在互动过程中模拟了类似人类的情感变化和内在思想,从而在多转交谈中对测试模型进行了更现实的评估 ...
在为人们制定政策,计划或设计时,设计师预见人们可能推理和行为的所有方式,这是一项挑战。最近,大型语言模型(LLM)已被证明能够模拟人类的推理。我们通过测量LLM在Ultimatum Game中模拟战略推理的能力来扩展这项工作,这是一个经典的经济学谈判实验 ...
基于大型语言模型的多代理系统正在彻底改变自主沟通和协作,但它们仍然容易受到安全威胁,例如未经授权的访问和数据泄露。为了解决这个问题,我们介绍了Admentafe,这是一个新颖的框架,可通过层次信息管理和内存保护来增强MAS安全性。 AgesentsAfe按安全级别对信息进行了分类,从而限制了对授权代理的敏感数据访问 ...
大型语言模型(LLM)的多代理系统(MAS)在各种复杂的任务中表现出了非凡的功能,从协作解决问题到自动决策。但是,随着这些系统越来越多地整合到关键应用中,它们对对抗性攻击,错误信息传播和意外行为的脆弱性引发了重大关注。为了应对这一挑战,我们介绍了G-Safeguard,这是一种拓扑指导的安全镜头和强大的LLM-MAS的处理,该镜头可利用图形神经网络来检测多代理性话语图形的异常情况,并采用拓扑干预进 ...