arxiv MasterKey: Automated Jailbreak Across Multiple Large Language Model Chatbots

名称
MasterKey: Automated Jailbreak Across Multiple Large Language Model Chatbots
首页
https://yiyibooks.cn/arxiv/2307.08715v2/index.html
原始地址
https://arxiv.org/abs/2307.08715
描述
大型语言模型 (LLM) 因其在理解和生成类人文本方面的卓越能力而彻底改变了人工智能 (AI) 服务。尤其是 LLM 聊天机器人已得到广泛采用,改变了人机交互。然而,这些 LLM 聊天机器人很容易受到“越狱”攻击,即恶意用户操纵提示来引发不适当或敏感的响应,从而违反服务策略 ...