基本信息 - MasterKey: Automated Jailbreak Across Multiple Large Language Model Chatbots

arxiv MasterKey: Automated Jailbreak Across Multiple Large Language Model Chatbots

阅读

Star 0

名称: MasterKey: Automated Jailbreak Across Multiple Large Language Model Chatbots

首页: https://yiyibooks.cn/arxiv/2307.08715v2/index.html

原始地址: https://arxiv.org/abs/2307.08715

描述

大型语言模型 (LLM) 因其在理解和生成类人文本方面的卓越能力而彻底改变了人工智能 (AI) 服务。尤其是 LLM 聊天机器人已得到广泛采用，改变了人机交互。然而，这些 LLM 聊天机器人很容易受到“越狱”攻击，即恶意用户操纵提示来引发不适当或敏感的响应，从而违反服务策略 ...