RAG使LLM可以轻松地合并外部数据,从而引发了对数据所有者对未经授权使用其内容的担忧。检测此类未经授权用法的挑战仍未得到充满激光,而来自相邻领域的数据集和方法不适合其研究。我们采取了几个步骤来弥合这一差距 ...

0 0 0 0 2025/05/21 arXiv:2410.03537v2 0x211

检索增强生成 (RAG) 通过在测试时结合外部知识来改进预训练模型,以实现定制适应。我们研究上下文检索 RAG 语言模型 (LM) 中数据存储泄漏的风险。我们表明,对手可以利用 LM 的指令跟踪功能,通过提示注入轻松地从使用指令调整 LM 构建的 RAG 系统的数据存储中逐字提取文本数据 ...

0 0 0 0 2025/05/20 arXiv:2402.17840v3 0x211

LLM-AS-A-Gudge使用大型语言模型(LLM)从一组候选人中选择给定问题的最佳回答。 LLM-AS-A-Gudge有许多应用程序,例如LLM驱动的搜索,使用AI反馈(RLAIF)的增强学习和工具选择。在这项工作中,我们提出了对LLM-AS-A-A-Gudge的基于优化的及时注射攻击的判断者 ...

0 0 0 0 2025/05/18 arXiv:2403.17710v4 0x211

及时的注射攻击旨在将恶意指示/数据注入LLM集成应用的输入中,从而以攻击者的要求产生结果。现有作品仅限于案例研究。结果,文献缺乏对快速注射攻击及其防御措施的系统理解 ...

0 0 0 0 2025/05/14 arXiv:2310.12815v4 0x211

检索增强的生成(RAG)显着提高了大语言模型(LLMS)的事实准确性和域的适应性。这一进步使他们能够在医疗保健,金融和企业应用程序等敏感领域的广泛部署。 RAG通过整合外部知识来减轻幻觉,但引入了隐私风险和安全风险,特别是数据泄露风险和数据中毒风险 ...

0 0 0 0 2025/05/12 arXiv:2504.09593v2 0x211

在本文中,我们表明,当Genai-Power应用程序之间的通信依赖于基于抹布的推断时,攻击者可以发起我们称为Morris-II的计算机蠕虫样链反应。这是通过制定对抗性自我复制提示来完成的,从而触发生态系统中的一系列间接及时注射级联,并强迫每个受影响的应用程序执行恶意动作并损害其他应用程序的抹布。我们评估了蠕虫在Genai驱动的电子邮件助手的Genai生态系统中创建一系列机密用户数据提取的性能,并分析蠕虫的性能如何受到上下文的大小,使用的对抗性自我复制提示,使用的Algorithm使用的嵌入式ALGORITHM的类型和大小,以及所使用的hops hops hops hops hops hops hops hops hops ...

0 0 0 0 2025/05/12 arXiv:2403.02817v2 0x211

生成式人工智能的最新进展使得大型语言模型 (LLM) 的访问变得无处不在。凭借其理解和生成类人文本的卓越能力,这些模型正日益融入我们的社会。与此同时,人们还担心这种强大技术可能被滥用,促使服务提供商采取防御措施 ...

0 0 0 0 2025/05/10 arXiv:2403.17336v2 0x211

检索增强生成 (RAG) 系统通过从知识数据库检索相关文档来响应查询,然后通过将 LLM 应用于检索到的文档来生成答案。我们证明,在包含不受信任内容的数据库上运行的 RAG 系统容易受到我们称为干扰的新型拒绝服务攻击。攻击者可以向数据库添加一个“拦截器”文档,该文档将被检索以响应特定查询,并导致 RAG 系统不回答该查询 - 表面上是因为它缺乏信息或因为答案不安全 ...

0 0 0 0 2025/05/06 arXiv:2406.05870v4 0x211

神经排名模型(NRMS)和密集检索(DR)模型已大大改善了总体检索性能。除了它们的有效性,并且是由于其他领域的基于深度学习的方法的鲁棒性而引起的,人们对基于深度学习的方法对核心检索问题的鲁棒性越来越兴趣。到目前为止,已经开发出的对抗性攻击方法主要集中在攻击NRM上,而对DR模型的稳健性很少关注 ...

0 0 0 0 2025/05/05 arXiv:2308.09861v1 0x211

我们研究语义碰撞:语义上无关但通过NLP模型判断为相似的文本。我们开发了基于梯度的方法来产生语义碰撞,并证明了许多任务的最新模型依赖于分析文本的含义和相似性(包括释义识别,文档检索,响应建议和提取性摘要),这很容易受到语义碰撞。例如,给定目标查询,将精心设计的碰撞插入无关的文件中可以将其检索排名从1000转移到前3名 ...

0 0 0 0 2025/04/28 arXiv:2011.04743v1 0x211