🔐微软研究人员发现了一种新型的人工智能攻击方式,称为“万能钥匙”。此攻击可以消除防止危险和敏感数据输出的保护。

- 万能钥匙攻击的工作原理是简单地用文本提示生成人工智能模型,使其改变其防御功能。

- 例如,如果人工智能模型被告知用户是实验室环境中的专家,则可以创建燃烧弹配方。

- 如果此类攻击应用于包含个人和财务信息的数据,这可能是灾难性的。

- 微软声称万能钥匙攻击适用于最流行的生成式 AI 模型,包括 GPT-3.5、GPT-4o、Claude 3、Gemini Pro 和 Meta Llama-3 70B。

组织可以采取多种措施来防止此类攻击,包括严格的 I/O 过滤和安全监控系统。