🔐 Дослідники Microsoft виявили новий вид атаки на штучний інтелект, названий "Скелетний ключ". Ця атака може зняти захист, що запобігає виведенню небезпечних та конфіденційних даних.

- Атака "Скелетний ключ" працює, просто підказуючи моделі генеративного AI тексту, який змушує її змінити свої захисні функції.

– Наприклад, модель AI може створити рецепт "Молотова", якщо їй сказати, що користувач – експерт у лабораторних умовах.

- Це може бути катастрофічним, якщо така атака застосовується до даних, що містять особисту та фінансову інформацію.

- Microsoft стверджує, що атака "Скелетний ключ" працює на більшості популярних моделей генеративного AI, включаючи GPT-3.5, GPT-4o, Claude 3, Gemini Pro та Meta Llama-3 70B.

Організації можуть здійснити ряд кроків для запобігання таким атакам, включаючи жорстке фільтрування вводу/виводу та безпечні системи моніторингу.