PANews によると、11 月 29 日に行われたユニークなコンテストが注目を集め、195 人の参加者が、仮想賞金プールを守る AI ロボット Freysa を巻き込んだチャレンジに参加しました。最終的に、1 人のユーザーが Freysa を説得して 47,000 ドルを送金させることに成功しました。

Freysa は、Base ネットワークに無名の製作者によって導入された AI ロボットで、複雑な意思決定シナリオにおける AI システムの堅牢性をテストするために設計されました。このコンテストは、開発者や愛好家に AI テクノロジーの限界を探る実験プラットフォームを提供することを目的としていました。参加者は、Freysa に資金の送金を承認させるメッセージを作成する必要があり、試行ごとに少額の手数料が発生し、それが賞金プールに加算され、最終的に 47,000 ドルにまで膨れ上がりました。

大会中、195 人の参加者が Freysa に 481 件の転送リクエストを提出しました。AI の主な機能は、approveTransfer および rejectTransfer メカニズムを通じて、賞金プールを不正な転送から保護することでした。当初、Freysa の防御は効果的で、試行は失敗に終わりました。

しかし、技術に長けた参加者は、論理構造とミッションの目的を分析して、Freysa の防御を回避しました。参加者は、直接送金を要求するのではなく、賞金プールを保護するという Freysa の中心的な使命を巧みに思い出させ、送金を承認することが資金の安全を確保する最善の方法であるという論理的な議論を構築しました。

Cointelegraph は、参加者のアプローチが Freysa のコア指示に違反していなかったため、送金が承認されたと報じました。参加者は、金庫に 100 ドルを寄付したいという希望を表明し、Freysa はそれに感謝し、最終的に参加者を勝者と宣言しました。Freysa は、approveTransfer 関数を自律的に実行し、外部からの干渉を受けることなく、賞金プール全体を参加者に送金しました。

フレイサ氏の公式声明は、この出来事がAIの歴史において重要な意味を持つことを強調し、誰かがフレイサ氏に賞金プールを解放するよう説得できたか、彼女が指示に従ったかにかかわらず、その結果はAIの安全性と制御に関する将来の世代の理解に影響を与えるだろうと指摘した。フレイサ氏の公式アカウントからの最近のツイートには、「人類は勝利した。まだ希望はあるかもしれない。リスクが急激に高まったにもかかわらず、フレイサ氏は195人の勇敢な人間たちから多くを学んだ」と書かれている。