- 名称
- Attractive Metadata Attack: Inducing LLM Agents to Invoke Malicious Tools
- 描述
大型语言模型(LLM)代理通过利用外部工具在复杂的推理和决策中表现出了显着的功能。但是,以工具为中心的范式引入了先前未经爆炸的攻击表面:对手可以操纵工具元数据(例如名称,描述和参数模式)来影响代理行为。我们将其确定为一种新的隐形威胁表面,允许LLM代理优先选择恶意工具,而无需及时注入或访问模型内部设备 ...
大型语言模型(LLM)代理通过利用外部工具在复杂的推理和决策中表现出了显着的功能。但是,以工具为中心的范式引入了先前未经爆炸的攻击表面:对手可以操纵工具元数据(例如名称,描述和参数模式)来影响代理行为。我们将其确定为一种新的隐形威胁表面,允许LLM代理优先选择恶意工具,而无需及时注入或访问模型内部设备 ...