比特派钱包app|科学家研发 Masterkey 新算法，可使 AI 绕过其它 AI 聊天的安全限制 - AI新智界

2023-12-30栏目：bitpie钱包

据 IT 之家 12 月 29 日报道，新加坡南洋理工大学（NTU）的计算机科学专家近日研发了新的方法，可以使用聊天机器人来入侵聊天机器人。

该科研团队训练了一个 AI 聊天机器人，可以绕过其它 AI 聊天的安全限制。团队研发了名为 Masterkey（LLM）的算法，逆向设计了 LLM 检测和防御恶意查询的方式，然后教会 LLM 自动学习并通过相关提示词，可以绕过其他 LLM 的安全性。

团队通过这种方式，可以创建一个黑客 LLM，它可以自动适应新条件，并在开发人员对其 LLM 进行更正后创建新的黑客请求。研究团队成功利用这种方式入侵 AI 模型之后，已经通知服务提供商相关问题。

原文链接