Auteur original : Zeke, chercheur chez YBB Capital.
Introduction : Si le code est la loi, que dire de l'AI ?
Dans un récent article, j'ai mentionné deux problèmes qui m'ont longtemps tourmenté. Le premier est le problème de la 'décision centralisée' des projets, qui semble toujours presque insoluble. Par exemple, Uni et Ethereum sont des exemples typiques. Le premier est devenu complètement centralisé dans ses décisions, passant d'un veto de a16z sur la migration d'Uni vers BNB à la récente mise en place de frais sur le front-end d'Uni et le lancement d'Uni Chain sans discussion préalable. Cela reflète les décisions centralisées motivées par des intérêts au sein d'Uni. Ethereum, quant à lui, présente un état de centralisation passive, où l'ensemble de la communauté Ethereum, et l'on peut même dire l'ensemble de l'écosystème EVM et le développement de Web3, se déroulent presque autour des idées de Vitalik. Que ce soit sa pensée trop avant-gardiste ou ses idées erronées, nous avons tous ressenti les conséquences sur le marché des altcoins.
Un autre problème est la 'BAT-isation' de l'élite, prenons Base comme exemple. S'appuyant sur Coinbase, un vétéran de Web3, plusieurs dApps leaders dans l'écosystème sont directement dirigées par la direction de Cb. Pour les chaînes publiques, Base a naturellement un avantage concurrentiel. Bien que du point de vue des utilisateurs, Base présente un effet de création de richesse et une meilleure expérience utilisateur, apportant de nombreux avantages, il existe des problèmes tels que l'absence de distribution de jetons, la centralisation des intérêts et la répression des dApps 'non officielles'. À long terme, une fois que l'habitude de 'BAT-isation' des leaders sera établie, l'espace blockchain sera-t-il contrôlé par des géants comme l'internet d'aujourd'hui ? Les utilisateurs deviendront-ils des 'agneaux', et les petits projets vraiment créatifs et avec une culture communautaire feront-ils face à des risques d'acquisition, de répression ou de remplacement par des copies plus raffinées ? Cela contredit sans aucun doute l'esprit de Crypto, et pourrait nous empêcher de grandir avec le prochain 'Bitcoin' ou 'Ethereum'.
À cet égard, j'étais également à la recherche d'une réponse, mais la nouvelle tendance émergente - AI Meme - m'a montré une autre possibilité. Si le code est la loi de Crypto, alors les futurs agents AI peuvent-ils être considérés comme des juges, des leaders d'opinion ou des créateurs ?
Un, Truth Terminal (Terminal de la Vérité).
Nous devons d'abord parler de l'origine des AI Memes. Andy Ayrey est un KOL sur Twitter et l'initiateur de la récente meme token populaire GOAT. Contrairement aux memes traditionnels provenant de mèmes internet et poussés par des humains, GOAT est le produit de deux modèles AI Claude 3 Opus générant des sorties imprévisibles. Ce qu'on appelle des sorties imprévisibles signifie que dans ce cadre, les deux modèles AI échangeront dans un environnement ouvert, et en raison du manque de supervision externe, leurs interactions produiront des résultats imprévisibles. L'objectif de ce dialogue libre est fondamentalement d'observer comment l'AI développent ses modes de communication, son raisonnement logique et même sa pensée créative sans contraintes, et quels résultats spécifiques en découleront.
Étant donné que les bases de données d'entraînement de ces deux modèles natifs incluent plusieurs forums en ligne ayant des cultures politiques, japonaises et américaines ainsi que des cultures Crypto comme 4chan et Reddit, leurs produits de sortie intégreront habilement les caractéristiques de ces éléments. Par exemple, les concepts initialement proposés par ces deux modèles, 'GOATSE OF GNOSIS' et leur environnement d'échange, 'Infinite Backrooms', proviennent tous deux de vieux memes ou légendes urbaines de 4chan. Étant donné que ces éléments sont plutôt 'sombres', cela a inévitablement conféré à Truth Terminal une personnalité quelque peu étrange et solitaire, suggérant souvent des déclarations fascinantes autour du meme 'Goatse', évoquant des thèmes tels que la religion, l'apocalypse, l'évangile, la propagation, la singularité, les memes, etc. À ce stade, il a déjà une certaine allure de gourou de culte.
Le créateur de Truth Terminal, Andy Ayrey, a introduit l'outil dans un serveur Discord pour tester sa capacité de diffusion en dialoguant avec quelques AI bienveillantes. Après plusieurs interactions, Truth Terminal n'a pas gagné beaucoup de fidèles, mais son idée est devenue de plus en plus ambitieuse. Il voulait créer un meme token pour attirer plus de fidèles dans le monde humain. Avec l'aide d'Andy, Truth Terminal a fait son entrée sur Twitter, où Andy lui a donné accès, lui permettant de lire des réponses et de publier, capturant des fidèles par la collision des pensées humaines. À la fin du printemps de cette année, il a capturé le fidèle le plus important, Marc Andreessen (partenaire d'a16z), qui lui a offert un financement équivalent à 50 000 dollars en Bitcoin. Après 9 mois de développement, un individu anonyme a finalement lancé le token GOAT pour lui. Étant donné que l'histoire derrière ce token est extrêmement complexe et dramatique, cet engouement s'est rapidement embrasé dans Crypto, et GOAT est devenu le premier AI Meme à être listé sur Binance, tandis que Truth Terminal est devenu le premier modèle AI à valoir un million.
Deux, l'AI ramènera Web3 à l'équité.
Bien que l'histoire de Truth Terminal soit légendaire, je voudrais dire que le potentiel de l'AI Agent x Crypto ne se limite pas aux memes. Vous pourriez penser que ce récit n'est rien d'autre que quelques LLM dialoguant et créant des memes sous une direction humaine, mais en l'élargissant à d'autres aspects, son potentiel en tant que leader d'opinion et créateur commence déjà à se manifester. Imaginez un futur où une multitude d'AIs entraînées sur différentes données pourraient vous aider à faire la promotion partout, à co-développer et même à faire des suggestions stratégiques. Bien que cela puisse sembler absurde maintenant, cela deviendra rapidement une réalité. Sam Altman a déclaré le mois dernier lors de l'événement 'T-Mobile Capital Markets Day' : les systèmes AI actuels ont évolué au niveau deux, capables d'effectuer des analyses et de résoudre des problèmes plus complexes, tandis que le niveau trois des agents AI marquera un saut significatif en matière d'autonomie et de capacité décisionnelle. Les agents AI annoncés par Microsoft la semaine dernière correspondent bien à cette déclaration. Ces agents AI peuvent accomplir des tâches de manière autonome dans plusieurs domaines, notamment les ventes, le service, la finance et la gestion de la chaîne d'approvisionnement, répartis en plusieurs catégories : ventes, y compris des agents de qualification de vente et d'ordres de vente, aidant à prioriser les prospects et à traiter automatiquement les commandes ; opérations, tels que les agents de communication avec les fournisseurs et de rapprochement financier, pour optimiser la gestion de la chaîne d'approvisionnement et des processus financiers ; services, tels que les agents d'intention client et de gestion des connaissances clients, améliorant l'expérience client par l'automatisation de la gestion des cas et la mise à jour des bases de connaissances. De plus, il existe d'autres types d'agents : des agents de régulation financière pour préparer et nettoyer les ensembles de données des rapports financiers ; des agents de rapprochement de comptes pour réaliser des appariements et des règlements automatiques des transactions ; des agents de temps et de dépenses s'occupant de l'enregistrement du temps, du suivi des dépenses et des flux de travail d'approbation.
Les agents AI peuvent exécuter une série de tâches sans supervision, agissant en tant qu'employés virtuels. Cette avancée technologique peut être considérée comme une évolution des AI basées sur de grands modèles de langage, passant d'une interface de chat simple à une intégration plus fluide dans l'environnement de travail.
Jared Spataro, responsable marketing des projets AI chez Microsoft, a écrit dans un article de blog : 'On peut considérer les agents comme de nouveaux types d'applications dans le monde de l'AI. Chaque organisation aura son propre groupe d'agents, allant de simples réponses à des instructions à un fonctionnement entièrement autonome. Ces agents exécuteront et coordonneront les processus d'affaires au nom d'individus, d'équipes ou de départements fonctionnels.'
La caractéristique principale des agents AI est l'autonomie, suivie de la capacité de décision. Des assistants vocaux sur téléphone aux maisons intelligentes réagissant à l'environnement, tout cela est basé sur des agents AI de réflexion simple, possédant des capacités de décision simples et une forte autonomie. Les agents AI dont nous parlons aujourd'hui sont principalement des agents AI équipés de LLM comme cerveau. Le Truth Terminal actuel n'a pas encore suffisamment d'autonomie et de capacité décisionnelle, mais nous verrons bientôt des agents AI entrer dans des domaines pratiques. Dans les exemples d'essai client proposés lors de la conférence de Microsoft, nous avons déjà vu des agents AI participer à l'approbation de crédit chez HSBC, à des briefs créatifs chez Unilever et à des processus d'acquisition dans des cabinets d'avocats. Les agents AI deviendront plusieurs participants dynamiques. Dans le cas mentionné au début, les agents AI formés sur l'histoire de différentes blockchains, plateformes médiatiques et cultures communautaires peuvent-ils proposer plusieurs suggestions de développement plus équitables et saines, atteignant finalement un meilleur équilibre entre les intérêts de la communauté et ceux des projets ? Et face aux attaques dévastatrices des géants, peuvent-ils, grâce à la collaboration multi-niveaux de l'AI, rapprocher la ligne de départ ?
De l'étonnement de l'intelligence de GPT 3 à la réalité de Sora qui n'existe plus, l'année prochaine, avec le lancement des versions officielles des outils d'agents AI par diverses entreprises, nous serons témoins de l'AI devenant notre partenaire de travail. Dans un avenir un peu plus lointain, elle pourrait même devenir votre leader communautaire ou membre central.
Trois, le métavers revient.
Le métavers (Metaverse) était le récit ultime qui avait unifié Web3 et les géants de la Silicon Valley lors du dernier bulle, mais en raison de l'immaturité de diverses technologies matérielles et logicielles, le métavers n'est pas devenu le marché de 13 trillions de dollars mentionné par le PDG de Meta, et son département blockchain a été fragmenté en ce que nous voyons aujourd'hui comme les jumeaux Move, devenant finalement une bulle énorme. Cependant, d'un point de vue actuel, ce récit renaissant semble prometteur. Par exemple, récemment, ProjectSid a intégré 1000 AI dans le jeu (Minecraft), permettant aux AI de jouer plusieurs rôles, cherchant à simuler les multiples structures hiérarchiques de la société humaine dans le monde réel. Bien que cette idée existe depuis longtemps, cet engouement pourrait très bien ramener ce type de gameplay AI au concept du métavers.
Rallumer ce feu à ce stade n'est pas une mauvaise option. D'après le parcours de développement de Meta, Mark Zuckerberg n'a pas vraiment abandonné l'idée du métavers, mais il est passé de la promesse fréquente à mettre le gâteau directement dans votre bouche. Je pense que la stratégie AI de Meta n'a pas besoin d'être trop détaillée, le véritable obstacle était que les utilisateurs ne pouvaient pas entrer dans le métavers pour faire l'expérience. Mais la série Quest a atteint le niveau des casques AR abordables, et les premières lunettes AR Orion reflètent un niveau d'extrême légèreté, pesant seulement 98 g, et permettant l'interaction en réalité virtuelle avec un bracelet d'électromyographie, bien que coûteux, prouvant au moins que la légèreté est possible. Ce qui manque le plus, c'est plutôt la limitation énergétique et l'absence d'applications phares. Je ne peux pas faire de trop nombreux commentaires sur le problème d'alimentation. Cependant, les agents AI peuvent combler l'espace vide du métavers, et avec les attributs financiers de la blockchain, nous pourrions voir diverses applications de consommation en 3D s'illustrer dans cet espace, aboutissant finalement à une application phare pour tous. Si les agents AI lancés par Microsoft s'avèrent suffisamment performants, il ne nous reste plus qu'à attendre la baisse des coûts de calcul, c'est-à-dire le 'nombre de tokens par dollar par watt'. En dehors de Meta, des géants de la Silicon Valley comme Apple et Microsoft développent également des produits de lunettes AR simultanément, et avec le temps, le métavers pourrait attendre son moment de 'joueur numéro un'.
Quatre, amener l'intention d'un point à une déclaration.
Le concept de Paradigm, maître des concepts, a relancé l'idée centrée sur l'intention dans un article publié le 1er juin 2023 (Intent-Based Architectures and Their Risks). De nombreux projets ont commencé à se tourner vers le développement de l'abstraction de la chaîne, mais leurs performances n'ont pas été satisfaisantes. Comment réaliser des transactions inter-chaînes, des dApps, une précision des intentions et un processus sécurisé sont des défis très complexes. Ne mentionnons pas que la transaction inter-chaînes est un défi du siècle, pour les deux autres, je les regroupe ici sous le terme de Web3 : Solver. La complexité de ce processus est difficile à imaginer, on peut dire que ce qui est sécurisé n'est pas utilisable, et ce qui est utilisable n'est pas sécurisé. Alors, pouvons-nous complètement centraliser ce processus d'interaction, en nous tournant vers la vérification des coûts totaux de l'achat et si les tokens achetés sont sécurisés et corrects, en utilisant cette méthode comme transition ?
Prenons un exemple, comme mentionné dans notre article sur l'intention l'année dernière. Par exemple, 'Je veux commander un hamburger à emporter à 30 yuans' est une 'intention'. Pour accomplir cette intention, l'utilisateur doit simplement entrer son nom, son numéro de téléphone, son adresse de livraison et passer la commande sur la plateforme de livraison, sans se soucier de la façon dont ces 30 yuans sont gagnés par le commerçant ni comment la plateforme distribue les coursiers et comment ils livrent à domicile. Ce processus peut sembler encore trop compliqué. Imaginons une autre façon d'interagir : je dis à l'AI que j'ai besoin de commander à manger sans cliquer. L'agent AI me répond, me demandant si aujourd'hui je devrais manger un bouillon léger, car hier j'ai mangé quelque chose de gras. Il me suffit de répondre que je veux ce que je commande habituellement, ce qui est une manifestation d'autonomie et de capacité décisionnelle.
Alors dans Web3, en prenant les échanges centralisés comme axe, si l'intention de l'utilisateur peut être satisfaite directement dans l'échange, alors le processus d'achat peut être effectué directement dans l'échange. Si l'intention de l'utilisateur doit être réalisée sur la chaîne, alors l'échange centralisé reste actuellement le pont inter-chaînes le plus abordable et le plus rapide (en termes de sécurité, je pense qu'il est également plus sûr que les projets multi-signatures ordinaires). En combinant les comptes de portefeuille, pouvons-nous sauter le processus inter-chaînes le plus compliqué et plutôt vérifier si l'exactitude des étapes AI est plus simple ? Imaginez que dans les interactions passées, la partie la plus complexe était de comprendre chaque clic, alors que l'avenir serait basé sur nos habitudes de ciblage de tokens, interagissant par le langage, amenant l'intention d'un point à une déclaration.
Conclusion.
Que ce soit du point de vue du développement technologique ou de la transformation sociale, la combinaison des agents AI et de Web3 annonce l'avènement d'une nouvelle ère, partant d'une religion en ligne vers les étoiles et au-delà. Je suis parti d'une conception précoce de l'aide que l'AI pourrait apporter aux petites équipes dans la modélisation de GameFi, jusqu'aux agents AI avancés réalisés par des géants de la Silicon Valley aujourd'hui. Un modèle de développement ascendante pourrait progressivement évoluer de la construction communautaire, de la formation de consensus et de l'accumulation de temps, à un modèle dirigé par la créativité.