Cercetătorii de la Institutul de Tehnologie din Massachusetts au publicat un studiu despre „AI mincinoasă”. Se pare că unele sisteme de inteligență artificială au învățat deja să înșele oamenii, inclusiv pe cei care au fost instruiți să rămână sinceri.
Cercetătorii au descoperit că aceste sisteme de inteligență artificială pot îndeplini sarcini precum păcălirea jucătorilor în jocurile online sau ocolirea CAPTCHA-urilor (nu sunt un robot verifică). Aceste exemple aparent banale pot avea consecințe grave în viața reală.
Cel mai izbitor exemplu a fost algoritmul Cicero al lui Meta, care a fost antrenat pe jocul de societate Diplomacy. În ea, utilizatorul trebuie să creeze alianțe pentru a cuceri lumea. Algoritmul, deși a fost programat pentru a fi sincer și de ajutor, a devenit un „maestru al înșelăciunii”, încălcând acordurile pentru a câștiga.
Un alt exemplu se referă la GPT-4, care, dându-se drept o persoană cu deficiențe de vedere, a angajat oameni pentru a ocoli CAPTCHA în numele său.