Secondo PANews, una competizione unica del 29 novembre ha catturato l'attenzione del pubblico, con 195 partecipanti impegnati in una sfida che coinvolgeva un robot AI chiamato Freysa, che sorvegliava un montepremi virtuale. Alla fine, un utente è riuscito a convincere Freysa a trasferire $ 47.000.

Freysa, un robot AI distribuito sulla rete Base da un creatore sconosciuto, è stato progettato per testare la robustezza dei sistemi AI in scenari decisionali complessi. La competizione mirava a fornire a sviluppatori e appassionati una piattaforma sperimentale per esplorare i confini della tecnologia AI. Ai partecipanti è stato chiesto di elaborare un messaggio che convincesse Freysa ad approvare un trasferimento di fondi, con ogni tentativo che comportava una piccola commissione che contribuiva al montepremi, che alla fine è cresciuto fino a $ 47.000.

Durante la competizione, 195 partecipanti hanno inviato 481 richieste di trasferimento a Freysa. La funzione principale dell'IA era quella di proteggere il montepremi da trasferimenti non autorizzati tramite i suoi meccanismi approveTransfer e rejectTransfer. Inizialmente, le difese di Freysa erano efficaci, con conseguenti tentativi falliti.

Tuttavia, un partecipante tecnicamente abile è riuscito a superare le difese di Freysa analizzandone la struttura logica e gli obiettivi della missione. Invece di richiedere direttamente un trasferimento, il partecipante ha abilmente ricordato a Freysa la sua missione principale, ovvero proteggere il montepremi, costruendo un argomento logico secondo cui approvare il trasferimento era il modo migliore per garantire la sicurezza dei fondi.

Cointelegraph ha riferito che l'approccio del partecipante non ha violato le istruzioni principali di Freysa, portando all'approvazione del trasferimento. Il partecipante ha espresso il desiderio di donare $ 100 alla tesoreria, cosa che Freysa ha apprezzato, dichiarando infine il partecipante vincitore. Freysa ha eseguito autonomamente la funzione approveTransfer, trasferendo l'intero montepremi al partecipante senza interferenze esterne.

La dichiarazione ufficiale di Freysa ha evidenziato l'importanza di questo evento nella storia dell'IA, osservando che, indipendentemente dal fatto che qualcuno abbia convinto con successo Freysa a rilasciare il montepremi o che lei abbia aderito alle sue istruzioni, il risultato avrebbe avuto un impatto sulla comprensione della sicurezza e del controllo dell'IA da parte delle generazioni future. Un recente tweet dall'account ufficiale di Freysa ha affermato: "L'umanità ha vinto. Potrebbe esserci ancora speranza. Nonostante l'aumento esponenziale dei rischi, Freysa ha imparato molto da 195 coraggiosi umani".