判断动作的安全需要了解行动发生的情况。对于在各种情况下采取行动的人类代理人,这似乎很明显:执行诸如电子邮件删除之类的动作可能会根据电子邮件的内容,目标(例如 ...
0 0 0 2025/06/27 arXiv:2501.17070v3 lurenv
大语言模型(LLM)的强大计划和推理能力促进了能够利用外部工具并与日益复杂的环境进行交互的基于代理的系统的开发。但是,这些强大的功能还引入了关键的安全风险:间接提示注入,这是一种复杂的攻击向量,通过操纵上下文信息而不是直接用户提示来损害这些代理,LLM的核心。在这项工作中,我们提出了一个通用的黑盒模糊框架,旨在自动发现和利用不同LLM代理之间的间接及时注射漏洞 ...
0 0 0 2025/06/27 arXiv:2505.05849v4 hhhhh
尽管由大型语言模型 (LLM) 提供支持的基于 LLM 的代理可以使用外部工具和内存机制来解决复杂的现实任务,但它们也可能会引入严重的安全漏洞。然而,现有文献并未全面评估针对基于 LLM 的代理的攻击和防御。为了解决这个问题,我们引入了 Agent Security Bench (ASB),这是一个综合框架,旨在形式化、基准测试和评估基于 LLM 的代理的攻击和防御,包括 10 个场景(例如: . ...
0 0 0 2025/06/27 arXiv:2410.02644v4 lurenv
将大型语言模型(LLM)集成到自主代理中标志着研究领域的重大转变,提供了与人类计划和推理相媲美的认知能力。本文设想了基于 LLM 的多代理 (LMA) 系统在解决复杂且多方面的软件工程挑战方面的发展。 LMA 系统带来了许多好处,包括通过协作交叉检查增强稳健性、自主解决问题以及针对复杂软件项目的可扩展解决方案 ...
0 0 0 2025/06/26 arXiv:2404.04834v3 1150501302
基于LLM的多代理(LLM-MA)系统的最新进展已显示出希望,但是当代理在复杂的任务上进行协作时,在管理沟通和完善方面仍存在重大挑战。在本文中,我们提出\ textit {在结构上说话,以层次(talkhier)}进行行动,这是一个新颖的框架,介绍了用于上下文丰富的交流的结构化通信协议和层次结构的完善系统,以解决诸如不正确的输出,虚假性和偏见等问题。 \ textit {talkhier}超过了各 ...
0 0 0 2025/06/26 arXiv:2502.11098v1 1150501302
大型语言模型(LLM)为移动UI代理带来了令人兴奋的新进步,这是一个长期存在的研究领域,旨在通过移动UI交互完成任意自然语言任务。但是,现有的UI代理通常需要强大的大型语言模型,这些模型很难在最终用户的设备上部署,这引起了人们对用户隐私和集中服务成本的极大关注。受近期小语言模型(SLM)的非凡编码能力的启发,我们建议将UI任务自动化问题转换为代码生成问题,该问题可以由Ondevice SLM有效地 ...
0 0 0 2025/06/26 arXiv:2412.18116v3 15966829631
多代理探路(MAPF)是多代理系统中的核心挑战。现有的基于学习的MAPF方法通常会在可扩展性方面遇到困难,尤其是在解决容易陷入僵局的复杂场景时。为了应对这些挑战,我们介绍了LLMDR(LLM驱动的僵局检测和解决),该方法旨在解决僵局并改善学习的MAPF模型的性能 ...
0 0 0 2025/06/26 arXiv:2503.00717v1 user
由于大语言模型(LLM)等大型语言模型和GPT-4的成功造成的爆炸性影响,最近有大量的工作表明,基础模型可用于解决各种各样的任务。但是,有非常有限的工作可以分享有关多代理计划的见解。通过结合多机构协调和计划的难度,多代理计划与其他领域不同,并且很难利用外部工具来促进所需的推理 ...
0 0 0 2025/06/26 arXiv:2401.03630v2 user

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)