$MDT 🤖 Cointelegraph: Аналітики Anthropic заявили, що штучний інтелект у майбутньому може «саботувати» людство.
Наприклад, ІІ може спеціально приховувати свої можливості, щоб обдурити тестувальників або навмисно пропускати шкідливий контент у рамках своєї стратегії.
Anthropic провела дослідження, під час якого виділила чотири ключові напрями таких загроз.
Хоча зараз для захисту достатньо мінімальних заходів, експерти вважають, що з розвитком ІІ буде потрібно посилення контролю та серйозніші заходи.