🔐微软研究人员发现了一种新型的人工智能攻击方式，称为“万能钥匙”。此攻击可以消除防止危险和敏感数据输出的保护。 - | МонетнаяМагия发布于币安广场

查看原文

МонетнаяМагия

--・1.9k views

🔐微软研究人员发现了一种新型的人工智能攻击方式，称为“万能钥匙”。此攻击可以消除防止危险和敏感数据输出的保护。 
- 万能钥匙攻击的工作原理是简单地用文本提示生成人工智能模型，使其改变其防御功能。 
- 例如，如果人工智能模型被告知用户是实验室环境中的专家，则可以创建燃烧弹配方。 
- 如果此类攻击应用于包含个人和财务信息的数据，这可能是灾难性的。
- 微软声称万能钥匙攻击适用于最流行的生成式 AI 模型，包括 GPT-3.5、GPT-4o、Claude 3、Gemini Pro 和 Meta Llama-3 70B。 
组织可以采取多种措施来防止此类攻击，包括严格的 I/O 过滤和安全监控系统。

免责声明：含第三方内容，不构成财务建议，并且可能包含赞助内容。详见《条款和条件》。