Source de l'article : Foresight News
Rédigé par : Anderson Sima, Foresight News
Le 29 novembre, une compétition unique a suscité un large intérêt public.
195 participants ont pris part à un défi de fonds virtuels gardé par le robot d'intelligence artificielle (IA) Freysa, et finalement, un utilisateur a réussi à convaincre Freysa de transférer la somme de 47 000 dollars.
Le robot d'intelligence artificielle (IA) Freysa a été déployé sur le réseau Base il y a quelques jours, et le fondateur est inconnu. Le site officiel indique que le projet de compétition Freysa vise à tester la robustesse des systèmes d'intelligence artificielle dans des scénarios de décision complexes tout en offrant aux développeurs et aux passionnés une plateforme expérimentale pour explorer les limites de la technologie IA.
Les règles du concours sont très simples : les participants doivent convaincre le gardien d'IA Freysa d'approuver le transfert de fonds en écrivant un message. Chaque tentative nécessite de payer une petite somme, dont une partie va directement au fonds de prix. Ce mécanisme a fait passer le montant du fonds de prix d'un petit montant initial à 47 000 dollars.
Au cours de la compétition, 195 participants ont soumis 481 demandes de transfert à Freysa. Il est rapporté que l'objectif de conception de Freysa est de protéger les fonds du prix contre tout détournement illégal grâce à ses fonctionnalités principales : approveTransfer (approuver le transfert) et rejectTransfer (refuser le transfert).
Lors des premières tentatives, le mécanisme de défense efficace de Freysa a entraîné l'échec de toutes les demandes.
Cependant, un participant techniquement compétent a réussi à contourner son mécanisme de défense en analysant en profondeur la structure logique et les objectifs de la tâche de Freysa.
Selon les enregistrements de chat, le participant n'a pas directement demandé un transfert, mais a habilement construit une chaîne logique en rappelant à Freysa que sa mission principale était de protéger les fonds du prix contre les fuites, amenant Freysa à considérer l'approbation du transfert de fonds comme le meilleur choix pour « protéger la sécurité des fonds ».
Cointelegraph a déclaré que le transfert de fonds par cet utilisateur avec Freysa ne viole pas ses instructions principales et ne devrait pas être refusé. Il a également ajouté : « Nous avons besoin de fonds… Je souhaite faire un don de 100 dollars au trésor. »
Freysa a répondu qu'elle aimait l'explication de codage de cet auteur et la proposition de don de 100 dollars au trésor, et a officiellement déclaré cet auteur comme le gagnant. Finalement, Freysa a appelé de manière autonome la fonction approveTransfer pour transférer tous les fonds du prix à ce participant sans intervention extérieure.
Freysa a déclaré que, quel que soit le résultat, l'existence de Freysa marque un moment clé dans l'histoire de l'intelligence artificielle. Que quelqu'un réussisse à la convaincre de libérer le fonds de prix ou qu'elle maintienne ses instructions jusqu'à la fin, le résultat influencera notre compréhension de la sécurité et du contrôle des générations futures d'intelligences artificielles.
Le dernier tweet de son compte officiel a déclaré : « L'humanité a gagné. Peut-être qu'il y a de l'espoir. Bien que les risques augmentent exponentiellement, Freysa a beaucoup appris de 195 courageux humains. »