🔐 Исследователи Microsoft обнаружили новый вид атаки на искусственный интеллект, названный "Скелетный ключ". Эта атака может снять защиту, предотвращающую вывод опасных и конфиденциальных данных.

- Атака "Скелетный ключ" работает, просто подсказывая модели генеративного AI текст, который заставляет её изменить свои защитные функции.

- Например, модель AI может создать рецепт "Молотова", если ей сказать, что пользователь - эксперт в лабораторных условиях.

- Это может быть катастрофическим, если такая атака применяется к данным, содержащим личную и финансовую информацию.

- Microsoft утверждает, что атака "Скелетный ключ" работает на большинстве популярных моделей генеративного AI, включая GPT-3.5, GPT-4o, Claude 3, Gemini Pro и Meta Llama-3 70B.

Организации могут предпринять ряд шагов для предотвращения таких атак, включая жесткое фильтрование ввода/вывода и безопасные системы мониторинга.