Le GPT-4 d’OpenAI, un modèle d’intelligence artificielle (IA) générative, a réussi le test de Turing, selon le co-fondateur d’Ethereum, Vitalik Buterin.

Le test de Turing est une référence nébuleuse pour les systèmes d’IA censés déterminer à quel point un modèle conversationnel ressemble à un humain. Le terme a été inventé en raison du célèbre mathématicien Alan Turing qui a proposé ce test en 1950.

Selon Turing, à l’époque, un système d’IA capable de générer un texte qui trompe les humains en leur faisant croire qu’ils ont une conversation avec un autre humain démontrerait la capacité de « pensée ».

Près de 75 ans plus tard, la personne largement reconnue pour avoir conçu la deuxième crypto-monnaie la plus populaire au monde a interprété les récentes recherches préliminaires de l'UC San Diego comme indiquant que le test de Turing avait finalement été « réussi » par un modèle de production.

Source : @Vitalik.eth sur Farcaster.

Des chercheurs de l'Université de Californie à San Diego ont récemment publié un article préimprimé intitulé "Les gens ne peuvent pas distinguer le GPT-4 d'un humain dans un test de Turing", dans lequel environ 500 sujets humains ont interagi avec des humains et des modèles d'IA dans un test aveugle pour déterminer si les sujets pouvaient comprendre lequel était lequel.

Selon la recherche, les humains ont déterminé par erreur que GPT-4 était un « humain » dans 56 % des cas. Cela signifie que la machine a trompé les humains en leur faisant croire que c'était l'un d'eux le plus souvent.

Le point de vue de Vitalik Buterin

Selon Buterin, un système d’IA capable de tromper plus de la moitié des humains avec lesquels il interagit est qualifié de réussi le test de Turing.

Selon un casting sur Farcaster, discutant des recherches récentes en prépublication :

« Cela signifie que la capacité des gens à savoir s'il s'agit d'un humain ou d'un robot est essentiellement un jeu de pile ou face ! »

Buterin a nuancé sa déclaration dans une parenthèse de suivi : « ok, pas tout à fait, parce que les humains sont devinés comme des humains 66 % du temps contre 54 % pour les robots, mais une différence de 12 % est infime ; dans n’importe quel contexte du monde réel qui compte fondamentalement comme une réussite.

Il a également ajouté plus tard, en réponse aux commentaires sur son casting original, que le test de Turing est « de loin l'étape la plus célèbre socialement acceptée pour « l'IA est une merde sérieuse maintenant ». Il est donc bon de se rappeler que ce cap est désormais franchi.»

Le test de Turing

L'intelligence générale artificielle (AGI) et le test de Turing ne sont pas nécessairement liés, même si les deux terminologies sont souvent confondues. Turing a formulé son test sur la base de son sens des mathématiques et a prédit un scénario dans lequel l'IA pourrait tromper les humains en leur faisant croire qu'ils étaient l'un d'entre eux par le biais d'une conversation.

Il convient de mentionner que le test de Turing est une construction éphémère sans véritable référence ni base technique. Il n’existe pas de consensus scientifique sur la question de savoir si les machines sont capables de « penser » comme le sont les organismes vivants ou sur la manière de mesurer un tel exploit. En termes simples, l’intelligence artificielle générale ou la capacité d’une IA à « penser » n’est actuellement ni mesurable ni définie par les communautés scientifiques ou techniques.

Turing a fait ses prédictions conceptuelles bien avant l’avènement des systèmes d’intelligence artificielle basés sur des jetons et l’apparition des réseaux contradictoires génératifs (GAN), précurseurs des systèmes d’IA génératifs d’aujourd’hui.

Intelligence générale artificielle

L’idée d’intelligence générale artificielle (AGI), qui est souvent associée au test de Turing, complique encore davantage les choses. Dans le langage scientifique, une « intelligence générale » est une intelligence qui devrait être capable de tout exploit fondé sur l’intelligence. Cela exclut les humains, car personne n’a démontré de capacités « générales » dans l’ensemble du spectre de l’activité intellectuelle humaine. Il s’ensuit donc qu’une « intelligence artificielle générale » aurait des capacités de pensée bien supérieures à celles de n’importe quel être humain connu.

Ceci étant dit, force est de constater que GPT-4 ne correspond pas à une véritable « intelligence générale » au sens strictement scientifique. Cependant, cela n’a pas empêché les membres de la communauté de l’IA de se déplacer autour des objectifs et d’utiliser le terme « AGI » pour désigner tout système d’IA capable de tromper un nombre important d’humains.

Dans la culture actuelle, il est courant de voir des termes et expressions tels que « AGI », « semblable à un humain » et « passe le test de Turing » comme faisant référence à tout système d’IA qui produit un contenu comparable à celui produit par les humains.

En relation : « Nous ne faisons qu’effleurer la surface » de la cryptographie et de l’IA – directeur de Microsoft