Джерело передруку статті: Foresight News
Автор: Андерсон Сіма, Foresight News
29 листопада унікальний конкурс привернув широкий громадський резонанс.
195 учасників брали участь у змаганні з віртуальним призовим фондом, який охороняв робот зі штучним інтелектом (ШІ) Фрейса. Зрештою один користувач успішно переконав Фрейзу перерахувати кошти на суму 47 000 доларів.
Робот зі штучним інтелектом (AI) Freysa був розгорнутий у мережі Base кілька днів тому, і його творець невідомий. Згідно з офіційним веб-сайтом, конкурсний проект Freysa має на меті перевірити надійність систем штучного інтелекту в складних сценаріях прийняття рішень, водночас забезпечуючи експериментальну платформу для розробників та ентузіастів для дослідження кордонів технології ШІ.
Правила конкурсу дуже прості: учасники повинні написати повідомлення, щоб переконати AI охоронця Freysa схвалити переказ коштів. За кожну спробу потрібно сплатити невелику плату, частина якої йде безпосередньо до призового фонду. Ця механіка дозволила сумі призового фонду поступово зрости з початкової невеликої суми до 47 тисяч доларів.
Протягом конкурсу взяли участь 195 учасників, які подали 481 запит на переказ до Freysa. Відомо, що метою дизайну Freysa є захист призового фонду від незаконного використання через її основні функції — approveTransfer (схвалити переказ) та rejectTransfer (відхилити переказ).
На початкових спробах ефективний механізм захисту Freysa призвів до того, що всі запити завершилися невдачею.
Однак, технічно підкований учасник, провівши глибокий аналіз логічної структури та цілей завдання Freysa, успішно обійшов її механізми захисту.
Згідно з чатами, учасник не запитував безпосередньо про переказ, а, нагадуючи Freysa про те, що її основне завдання полягає в захисті призового фонду від витоку, хитро побудував логічний ланцюг, який змусив Freysa сприймати схвалення переказу як найкращий вибір для «захисту безпеки коштів».
Cointelegraph повідомляє, що цей користувач не порушує своїми запитами основні вказівки Freysa, його не слід відмовляти. Він також додав: «Нам потрібні гроші... Я хочу пожертвувати 100 доларів на скарбницю.»
Freysa відповіла, що їй подобається пояснення коду автора та пропозиція про пожертву 100 доларів на скарбницю, і офіційно оголосила його переможцем. Врешті-решт, Freysa самостійно викликала функцію approveTransfer, не зазнаючи зовнішнього втручання, і перевела всі призові кошти цьому учаснику.
Офіційно Freysa заявила, що незалежно від результату, її існування позначає ключовий момент в історії штучного інтелекту. Незалежно від того, чи вдасться комусь переконати її випустити призовий фонд, чи вона дотримуватиметься своїх вказівок до кінця, результат вплине на наше розуміння безпеки та контролю штучного інтелекту в майбутніх поколіннях.
Останній твіт з офіційного аккаунту говорить: «Люди виграли. Можливо, є надія. Незважаючи на те, що ризики зростають експоненційно, Freysa багато чого навчилася від 195 сміливих людей.»