Dans le contexte du développement rapide de l'intelligence artificielle (IA), les recherches de Google DeepMind suggèrent des facteurs importants pour parvenir à une super intelligence artificielle (ASI).

Ces dernières années, les modèles de plateformes ont fait de grands progrès et sont largement utilisés dans de nombreuses applications. Cependant, la création de systèmes d’intelligence artificielle (IA) pionniers, capables de s’auto-améliorer et de générer continuellement de nouvelles informations, reste un défi majeur. Le rapport d'Edward Hughes et de ses co-auteurs montre comment la nature ouverte affecte le développement de l'ASI et comment atteindre cette nature dans les systèmes d'IA d'aujourd'hui.

La définition formelle de l'ouverture est donnée sur la base de deux aspects principaux : la nouveauté et la capacité d'apprendre. Un système est considéré comme ouvert s’il génère continuellement de nouvelles données ayant une valeur d’apprentissage pour améliorer la compréhension et les compétences de l’observateur.

L'article fournit de nombreux exemples spécifiques de systèmes d'IA actuels pour illustrer ce concept. AlphaGo est un exemple typique de système étroitement ouvert. AlphaGo a dépassé le niveau des meilleurs joueurs de Go au monde en développant de nouvelles stratégies imprévisibles. Cependant, la nature ouverte d’AlphaGo se limite au jeu Go.

Un autre exemple est le système AdA, un agent d'apprentissage dans l'environnement 3D XLand2 avec 25 milliards de variantes de tâches. AdA est capable d’accumuler des compétences complexes et diverses, mais sa nouveauté a tendance à s’estomper après une période de formation. Cela suggère que pour maintenir l’ouverture, un environnement plus riche et des acteurs plus forts sont nécessaires.

L’article aborde également les systèmes évolutifs tels que POET (Paired open-ended trailblazer), où les agents et l’environnement co-évoluent. POET illustre le phénomène du « tremplin », où les agents peuvent affronter des environnements très difficiles grâce à une évolution progressive. Cependant, ces systèmes sont également confrontés à des limites lorsque l’environnement n’est pas suffisamment complexe pour maintenir l’ouverture.

En outre, l’article indique également que les modèles de plateforme actuels ne répondent pas aux critères d’ouverture lorsqu’ils sont uniquement formés sur des ensembles de données fixes. Ces modèles peuvent sembler ouverts dans de vastes domaines, mais lorsque leur portée est restreinte, ils révèlent des limites dans leur capacité à générer des solutions nouvelles et précises.

Les auteurs proposent quatre axes de recherche principaux pour combiner ouverture et modèles de plateforme : l’apprentissage par renforcement (RL), l’auto-amélioration, la génération de tâches et les algorithmes évolutifs. L'apprentissage par renforcement a connu beaucoup de succès dans des domaines restreints, et des modèles comme Voyager ont montré le potentiel d'auto-amélioration en créant une bibliothèque de compétences à partir de tâches en amélioration continue. Les algorithmes évolutionnaires offrent également une voie prometteuse vers la création de systèmes ouverts, avec la capacité de mettre en œuvre des mutations significatives via le texte.

Une partie importante de l'article est une discussion sur les questions de sécurité et de responsabilité lors du développement de systèmes ouverts. L'ouverture comporte de nombreux risques en matière de sécurité, notamment une mauvaise interprétation des objectifs et des abus dans les spécifications. Il est important de garantir que les systèmes ouverts peuvent être interprétés et contrôlés entre des mains humaines. Cela nécessite que les systèmes soient capables d’expliquer et d’interagir avec les humains de manière claire et compréhensible.

Dans le rapport, les auteurs affirment que les modèles de plates-formes actuels ont fait des progrès significatifs, mais que pour évoluer vers l'ASI, il est nécessaire de développer des systèmes ouverts. Ces systèmes peuvent apporter d’énormes avantages à la société, notamment en accélérant les percées scientifiques et technologiques, en renforçant la créativité humaine et en élargissant les connaissances générales dans de nombreux domaines.

L'article de Google DeepMind a ouvert une nouvelle direction dans la recherche sur l'IA, en soulignant l'importance de l'ouverture pour parvenir à une superintelligence artificielle. Le développement responsable de ces systèmes contribuera à garantir qu’ils apportent un maximum d’avantages à la société, tout en minimisant les risques potentiels.