L’avenir de l’intelligence artificielle pourrait davantage s’apparenter à une prise de contrôle des entreprises qu’à une révolte des robots, selon Dario Amodei, PDG de la société d’intelligence artificielle Anthropic.

Amodei a récemment discuté de l'avenir de l'IA dans une interview avec Noah Smith et Erik Torenberg sur le podcast Econ 102. Le trio a abordé tous les sujets, de l'utilisation militaire de l'IA au remplacement des travailleurs humains par des machines plus efficaces.


Mais ce qui est peut-être le plus intéressant, c’est qu’Amodei a évoqué les efforts internes de l’entreprise pour développer une structure hiérarchique efficace permettant d’accomplir des tâches via un réseau de modèles d’intelligence artificielle.

Des réseaux à l'intérieur des réseaux

L’IA que la plupart des gens connaissent aujourd’hui se présente sous la forme de chatbots et de générateurs d’images. ChatGPT d’OpenAI et Claude d’Anthropic sont des systèmes d’IA de pointe qui, indépendamment, ont coûté des dizaines de milliards de dollars à développer.

Mais la plupart des applications utiles pour la technologie qui sous-tend ces systèmes ne nécessitent pas toutes leurs capacités. Si, par exemple, vous utilisez Claude pour générer du code Python pour une application Web3, vous ne tirerez probablement aucun avantage de la capacité du modèle à générer de la poésie en français.

Comme l’a décrit Amodei dans l’interview, la réflexion actuelle de l’entreprise semble impliquer l’idée d’essaims d’IA capables de se mettre en réseau pour accomplir des tâches spécifiques.

Le principe de base serait que « de grands modèles orchestraient de petits modèles ». Amodei a ajouté que les modèles plus grands créeraient jusqu'à des centaines de modèles plus petits, plus rapides et plus efficaces pour effectuer des tâches.

Bien qu’Amodei ait utilisé l’analogie des abeilles ouvrières soutenant leur reine, ce qu’il a décrit ressemble beaucoup à une infrastructure d’entreprise typique.

Au sommet se trouve le modèle Claude, le système le plus puissant d’Anthropic. Sous celui-ci se trouvent plusieurs modèles fondamentaux coûteux, formés dans des domaines très divers tels que les mathématiques, la programmation et l’analyse des sentiments. Sous ces machines de la haute direction se trouve une litanie de modèles spécialisés dédiés à l’exécution de tâches spécifiques. Et enfin, sous les spécialistes des cadres intermédiaires, on trouve les modèles d’entrée de gamme, uniques, conçus pour une utilisation à court terme.

L’avantage de cette conception pourrait potentiellement signifier que les utilisateurs finaux à tous les niveaux auraient accès aux fonctionnalités spécifiques dont ils ont besoin via une interface utilisateur unique et simple.


En lien : La physique pour la fintech : comment l'IA quantique peut rendre les humains meilleurs traders de crypto-monnaies