Auteur original : Wang Chao
Source originale : Empower Labs
Le 23 mars, le controversé PDG de Stability AI, Emad Mostaque, a annoncé sa démission et se consacrera à l'avenir entièrement à l'industrie décentralisée de l'IA. Cette nouvelle a provoqué un véritable choc sur le marché.
D'une part, Stability.AI portait autrefois à elle seule la bannière de l'IA open source et a apporté d'importantes contributions à l'IA open source, d'autre part, elle a été constamment accusée de s'approprier seule les résultats d'autres équipes de recherche ; La révélation des faux diplômes universitaires du PDG Emad et ses fréquents mensonges sur les réseaux sociaux ont encore davantage nui à sa réputation. Bénéficiant autrefois d’un soutien étincelant des investisseurs et d’un financement énorme, Stability.AI est depuis longtemps en proie à de graves difficultés financières et sa vie ne tient qu’à un fil.
Après sa démission, Emad a révélé qu'il détenait toujours une participation majoritaire dans Stability.AI, suffisamment pour contrôler le conseil d'administration. Il n'a pas été contraint de démissionner, mais estimait que la forte concentration du pouvoir dans le domaine de l'IA était préjudiciable à tout le monde, il a donc choisi de démissionner pour promouvoir des changements dans Stability.AI. Étant donné le passé douteux d’Emad en matière de vantardise, la plupart des gens pensaient qu’il y avait plus que cela. Cependant, plutôt que Stability.AI, j'aimerais discuter de l'IA décentralisée dans laquelle Emad sera impliqué.
Il y a quelques semaines, j'ai participé à une discussion autour de l'IA décentralisée avec Emad. Ensuite, j’ai compilé bon nombre de ses discours antérieurs sur cette question et j’ai décrypté grossièrement son point de vue.
Celui qui contrôle le modèle contrôle l'esprit
Si les actions humaines sont pilotées par un système d’exploitation, l’IA devient rapidement un composant externe central de ce système d’exploitation. Parce que les humains se sont progressivement adaptés à l’externalisation du fardeau de la réflexion vers l’IA, cette technologie fait partie de notre façon de penser. Cependant, la commodité et l'autonomisation apportées par l'IA comportent également des risques importants : celui qui contrôle le modèle d'IA contrôlera dans une certaine mesure la pensée du monde.
Si nous ne sommes pas conscients du fonctionnement de ces outils intelligents et de leurs paramètres par défaut, nos décisions et nos opinions peuvent être silencieusement affectées. Le contrôleur du modèle d'IA peut guider subtilement les choix, les opinions et les comportements des gens en définissant des options par défaut spécifiques. En tant qu’infrastructure de la prochaine ère, si l’IA est contrôlée par seulement quelques groupes d’entreprises, les conséquences pourraient être désastreuses. C’est ce qu’Emad a souligné, l’importance et l’urgence de l’IA décentralisée.
Chaque pays a besoin de son propre modèle
Lorsqu'OpenAI investira énormément d'énergie dans le projet Super Alignment, qui sera responsable de l'alignement entre OpenAI lui-même et chaque pays, chaque industrie et chaque culture du monde ?
Personne.
Le Super Alignement d’OpenAI a déployé de grands efforts en matière de sécurité de base et d’éthique humaine commune, mais ces efforts sont-ils suffisants face à la diversité des différents pays et cultures ? Les différentes nations et cultures ont souvent des points de vue très différents des valeurs des élites de la Silicon Valley, et peuvent-elles le faire ? plusieurs valeurs doivent-elles être équitablement reflétées dans le modèle d'IA ? Lorsque des pays comme le Kenya commenceront à utiliser l’IA de la Silicon Valley pour apprendre à grande échelle auprès de leur prochaine génération d’étudiants, leurs caractéristiques culturelles nationales uniques disparaîtront-elles progressivement ?
La réponse n'est pas optimiste. Par conséquent, Emad estime que chaque pays, chaque industrie et chaque culture devrait disposer d’un modèle d’IA qui représente ses propres caractéristiques. Ces modèles doivent être profondément enracinés dans la région locale, absorber et refléter pleinement la sagesse collective du pays, de l’industrie et de la culture. Ce concept devrait être familier à tout le monde, car NVIDIA a également évoqué le concept d'IA souveraine à plusieurs reprises il y a deux mois, ce qui est essentiellement la même chose. Cependant, Emad a commencé à en parler à plusieurs reprises il y a un an ou deux, soit bien avant Nvidia.
La plupart des pays dans le monde n’ont tout simplement pas la capacité de créer leurs propres modèles d’IA, et c’est exactement le marché ciblé par Emad. Il espère créer une pile sous-jacente pour prendre en charge les modèles d’IA créés par chaque pays, nation et industrie. Sur la pile, nous espérons utiliser la collaboration collective décentralisée pour réaliser le développement de modèles.
Emad a déclaré qu'il pourrait créer/incuber une série d'entreprises, chacune d'entre elles comptant différents professionnels se concentrant sur différents domaines clés, tels que l'éducation, les soins médicaux, la finance et, bien sûr, les modèles d'IA pour différents pays. En tant que pratique de l’IA décentralisée, ces entreprises jouent davantage un rôle d’initiateur. En fournissant des modèles de base et des cadres standardisés, nous pouvons amener les talents de la communauté à participer et à contribuer. Si un grand nombre de talents exceptionnels d’un pays peuvent être attirés pour contribuer, cette sagesse collective finira par converger vers un excellent modèle national.
Le cœur, ce sont les données
Pour utiliser une métaphore simple, la recette d’un modèle d’IA repose sur des algorithmes et des données, puis une certaine puissance de calcul est utilisée pour les mélanger. Plus il y a de données, plus la puissance de calcul requise pour les mélanger est grande. À l'heure actuelle, la plupart des équipes sur le marché recherchent de meilleurs algorithmes de modélisation, obtiennent plus de données, puis les associent à une plus grande puissance de calcul. Mais la pratique a prouvé que si la qualité des données est élevée, d’excellents résultats peuvent être obtenus avec moins de données. En d’autres termes, les gens effacent les données de mauvaise qualité en empilant la puissance de calcul.
Cela constitue un avantage du système d’IA décentralisé prôné par Emad. Il estime que si une structure peut être établie pour guider les meilleurs talents d'un pays à participer ensemble, des ensembles de données nationales de haute qualité peuvent être rassemblés dans le même temps, ces données peuvent être vérifiables et avoir une appropriation claire, ainsi que des incitations. les données peuvent être conçues.
De cette façon, nous pouvons collecter des données qui étaient tout simplement hors de portée dans le passé. Ces données sont non seulement de meilleure qualité, mais elles représentent également plus fidèlement et plus équitablement les voix et les besoins du public.
Groupe de petits modèles vs grand modèle unique
Dans le domaine de l’IA, les lois de mise à l’échelle sont presque devenues une loi d’airain. Que nous choisissions de les poursuivre ou non, nous ne pouvons pas les éviter.
De toute évidence, utiliser une approche décentralisée pour organiser les ressources, puis utiliser la loi Scalling pour parvenir à une intelligence artificielle générale (AGI) n’est pas réaliste à court terme. Depuis un certain temps, les modèles d’IA axés sur la communauté ont également du mal à rivaliser avec des géants comme OpenAI pour la couronne du modèle le plus puissant.
Cependant, poursuivre l’AGI et créer une IA largement applicable sont deux choses différentes. À mesure que la technologie continue de progresser, les modèles de petite et moyenne taille pilotés par la communauté augmentent rapidement leurs capacités. On s'attend à ce que d'ici un an ou deux, des modèles de petite et moyenne taille suffisent pour la plupart des tâches quotidiennes. Ce n'est peut-être pas le plus puissant, mais il est suffisamment pratique et suffisamment peu coûteux pour ouvrir un large éventail de scénarios d'application. Tout comme la plupart de nos achats en ligne ne nécessitent pas SF Express pour une livraison le lendemain, l'utilisation mixte des modèles deviendra progressivement courante à l'avenir.
Cela entraîne un changement extrêmement important : lorsque les modèles pilotés par l’intelligence collective sont largement utilisés, les risques potentiels provoqués par un seul grand modèle contrôlé par une seule organisation sont considérablement réduits. Si les données d’un grand modèle sont contaminées, ces modèles basés sur l’intelligence collective peuvent facilement servir de calibrateurs et apporter les corrections nécessaires. Il ne s’agit pas seulement d’aspect pratique et d’économies de coûts, mais aussi d’un jeu entre l’intelligence collective et l’IA Dieu.
D'un point de vue technique, les petits modèles ne sont pas entièrement un inconvénient. La petite taille leur permet de réaliser plus facilement des entraînements complémentaires spécifiques à la verticale. Dans ces domaines, ils fonctionnent bien en tant qu’outils de niveau expert, même si leurs capacités globales ne sont peut-être pas aussi complètes que celles de modèles plus grands. Un petit groupe de modèles composé de nombreux modèles experts ne perdra pas nécessairement face à un seul grand modèle.
Plus important encore, un petit modèle peut efficacement promouvoir la décentralisation du déploiement. Lorsque nous parlons de décentralisation, nous ne faisons pas seulement référence à la décentralisation de la construction des modèles et des sources de données, mais également à la décentralisation de la gouvernance et à la décentralisation du déploiement. Si les modèles open source peuvent être facilement déployés sur des ordinateurs portables personnels ou même sur des téléphones mobiles, cela constituera l’égalité en matière d’IA. Même si le fournisseur de services centralisé arrête le service, les utilisateurs peuvent toujours compter sur l’IA locale pour poursuivre leurs opérations. Permettre aux gens d’utiliser largement l’IA sans restrictions est également un objectif important de l’IA décentralisée.
AI + Web3 – Les menteurs ou le futur
Il ne fait aucun doute que l’initiative d’IA décentralisée promue activement par Emad est étroitement liée à la cryptographie. Il a déclaré vouloir concevoir un protocole Web3 pour intégrer et mettre en œuvre ces idées. En effet, plusieurs éléments clés qui manquent actuellement dans le domaine de l'IA - la vérifiabilité des données, la propriété des données, les mécanismes de coordination et d'incitation à grande échelle et les capacités de gouvernance collective - sont exactement ce pour quoi la technologie Web3 est performante.
Ici, je voudrais me concentrer sur la gouvernance. Parce qu’il n’y a jamais eu de technologie aussi puissante que l’intelligence artificielle d’aujourd’hui, et qu’elle affectera largement et profondément tous les coins du monde. Qui devrait décider de l’orientation future de cette technologie ? Qui peut le contrôler efficacement ? Gouverner l’intelligence artificielle par le conseil d’administration de quelques entreprises comme OpenAI n’est certainement pas la solution la plus efficace. Le simple fait d’imposer des contraintes strictes aux modèles d’IA par les régulateurs ne résout pas nécessairement efficacement les défis. La gouvernance collective pourrait être la véritable solution.
Dans le domaine du Web3, les expériences de gouvernance collective fleurissent, couvrant de multiples niveaux tels que la gouvernance des données, la gouvernance des applications, la gouvernance des réseaux et la gouvernance des organisations. Même si la plupart des tentatives en sont encore au stade exploratoire et ont connu de nombreux échecs, il s’agit là d’une avancée majeure en matière de développement de la gouvernance humaine.
Au cours des cinq dernières années, les acteurs du secteur de la cryptographie, en particulier ceux des organisations autonomes décentralisées (DAO), ont essayé presque tous les modèles de gouvernance de l’histoire de l’humanité. La structure innovante adoptée par OpenAI, dans laquelle une fondation à but non lucratif contrôle une entreprise rentable, a déjà été largement pratiquée dans le DAO. Il me semble que les gens du monde Web3 se sont livrés à un speedrun de gouvernance ces dernières années. En quelques années seulement, les hommes ont réinterprété des milliers d’années de gouvernance humaine.
L'une des critiques les plus courantes est que la plupart des gouvernances Web3 ne sont qu'une copie du modèle de gouvernance que les humains ont eu dans le passé, auquel a ensuite été ajouté le vote en chaîne. Cependant, l’histoire nous a appris qu’avec un taux de croissance aussi rapide et une forte densité de talents, des choses complètement nouvelles vont bientôt évoluer.
Un exemple moins pertinent est celui de la publicité sur Internet. Je me souviens des années où Internet commençait à peine. Lorsque vous ouvrez un site Web d'information, une énorme publicité en plein écran apparaît soudainement, puis disparaît lentement. La page Web est remplie de blocs publicitaires denses. les débuts d'Internet. Parce qu’à cette époque, les gens ne savaient pas ce qu’était un moyen plus efficace de promouvoir sur Internet, ils ont donc simplement déplacé les méthodes publicitaires des médias traditionnels vers Internet. Cependant, à mesure que la scène progressait et que les gens approfondissaient leur compréhension de la technologie et de la culture Internet, un modèle de promotion efficace sans précédent dans l’histoire de l’humanité a rapidement évolué et la publicité traditionnelle a été rapidement éliminée sur Internet.
Selon moi, la gouvernance de la technologie suivra également un chemin similaire à celui de la publicité sur Internet. La technologie Blockchain apporte des capacités de coordination et de gouvernance considérablement améliorées, et je suis pleinement convaincu que des solutions de gouvernance collective sans précédent dans l’histoire de l’humanité en découleront.
écris à la fin
Il est difficile de prédire l'avenir de l'ère de l'IA et d'examiner toutes les idées d'Emad à l'heure actuelle, et il est difficile de tirer une conclusion. De toute évidence, ses projets se heurtent à d’énormes défis à plusieurs niveaux. De plus, Emad a souvent exagéré dans le passé, et il n'est pas facile de distinguer lesquels de ses propos peuvent être pris au sérieux et lesquels ne sont que des remarques fortuites.
Cependant, l’exploration de la structure du pouvoir de l’IA constitue une question précoce, extrêmement complexe et importante. Emad et d'autres collègues qui poursuivent l'IA décentralisée, leur réflexion et leurs tentatives, même s'ils ne sont peut-être pas proches de la réponse finale, méritent suffisamment de respect et d'attention. Même si ces explorations sont difficiles, elles constituent des tentatives courageuses pour créer l’avenir. Ces efforts, quels qu’en soient les résultats, constitueront un chapitre de l’épopée historique.
Peut-être qu'un jour, le monde remerciera Emads.