$MDT 🤖 Cointelegraph: Аналитики Anthropic заявили, что искусственный интеллект в будущем может «саботировать» человечество.

Например, ИИ может специально скрывать свои возможности, чтобы обмануть тестировщиков, или намеренно пропускать вредоносный контент в рамках своей стратегии.

Anthropic провела исследование, в ходе которого выделила четыре ключевых направления таких угроз.

Хотя сейчас для защиты достаточно минимальных мер, эксперты считают, что с развитием ИИ потребуется усиление контроля и более серьезные меры.