Auteur : 0XNATALIE
Depuis le deuxième semestre de cette année, le sujet des agents IA a continué à gagner en popularité. Au départ, le chatbot IA terminal of truths a attiré l'attention grâce à ses publications et réponses humoristiques sur X (similaire à 'Robert' sur Weibo) et a reçu un financement de 50 000 dollars de Marc Andreessen, fondateur d'a16z. Inspiré par son contenu publié, quelqu'un a créé le jeton GOAT, qui a augmenté de plus de 10 000 % en seulement 24 heures. Le sujet des agents IA a immédiatement suscité l'intérêt de la communauté Web3. Par la suite, le premier fonds de trading IA décentralisé basé sur Solana, ai16z, a été lancé, introduisant le cadre de développement d'agents IA Eliza, ce qui a déclenché une bataille pour les jetons majuscules et minuscules. Cependant, la communauté n’a toujours pas une compréhension claire du concept d’agent IA : quel est son cœur ? En quoi est-il différent des bots de trading Telegram ?
Principe de fonctionnement : perception, raisonnement et prise de décision autonome
L'agent IA est un système d'agent intelligent basé sur de grands modèles de langage (LLM), capable de percevoir l'environnement, de raisonner et de prendre des décisions, et d'accomplir des tâches complexes par l'appel d'outils ou l'exécution d'opérations. Flux de travail : module de perception (obtention des entrées) → LLM (compréhension, raisonnement et planification) → appel d'outils (exécution des tâches) → retour et optimisation (validation et ajustement).
Concrètement, l'agent IA obtient d'abord des données de l'environnement externe à travers le module de perception (comme du texte, de l'audio, des images, etc.) et les transforme en informations structurées pouvant être traitées. Le LLM, en tant que composant central, offre de puissantes capacités de compréhension et de génération de langage naturel, agissant comme le 'cerveau' du système. Sur la base des données d'entrée et des connaissances existantes, le LLM effectue un raisonnement logique, générant des solutions possibles ou élaborant des plans d'action. Ensuite, l'agent IA accomplit des tâches spécifiques en appelant des outils externes, des plugins ou des API, et valide et ajuste les résultats en fonction des retours, formant ainsi une optimisation en boucle fermée.
Dans les scénarios d'application de Web3, quelle est la différence entre un agent IA et un bot de trading Telegram ou un script automatisé ? Prenons l'arbitrage comme exemple. Un utilisateur souhaite effectuer un arbitrage lorsque le profit est supérieur à 1 %. Dans un bot de trading Telegram prenant en charge l'arbitrage, l'utilisateur définit une stratégie de trading de profit supérieur à 1 %, et le bot commence à exécuter. Cependant, lorsque le marché est volatile et que les opportunités d'arbitrage changent constamment, ces bots manquent de capacité d'évaluation des risques. Dès que la condition de profit supérieur à 1 % est remplie, ils exécutent l'arbitrage. En revanche, l'agent IA peut ajuster automatiquement sa stratégie. Par exemple, lorsque le profit d'une transaction dépasse 1 %, mais qu'une analyse des données évalue que le risque est trop élevé, le marché pouvant soudainement changer entraînant des pertes, il décidera de ne pas exécuter cet arbitrage.
Ainsi, les agents IA possèdent une auto-adaptabilité, leur principal avantage résidant dans leur capacité à apprendre par eux-mêmes et à prendre des décisions autonomes. En interagissant avec l'environnement (comme le marché, le comportement des utilisateurs, etc.), ils ajustent leur stratégie comportementale en fonction des signaux de retour, améliorant continuellement l'efficacité de l'exécution des tâches. Ils peuvent également prendre des décisions en temps réel basées sur des données externes et optimiser leurs stratégies décisionnelles grâce à l'apprentissage par renforcement.
Dit comme ça, n'est-ce pas un peu comme un solveur dans le cadre des intentions ? L'agent IA est également un produit basé sur les intentions, la plus grande différence avec le solveur dans le cadre des intentions étant que le solveur repose sur des algorithmes précis, ayant une rigueur mathématique, tandis que les décisions de l'agent IA dépendent de l'entraînement des données, nécessitant souvent d'approcher la solution optimale par un processus d'essais et d'erreurs.
Cadres d'agents IA dominants
Le cadre d'agent IA est l'infrastructure utilisée pour créer et gérer des agents intelligents. Actuellement, dans Web3, les frameworks populaires incluent Eliza d'ai16z, ZerePy de zerebro et GAME de Virtuals.
Eliza est un cadre d'agent IA multifonctionnel, construit avec TypeScript, prenant en charge l'exécution sur plusieurs plateformes (comme Discord, Twitter, Telegram, etc.) et, grâce à une gestion complexe de la mémoire, capable de se souvenir des dialogues et du contexte précédents, maintenant des caractéristiques de personnalité et des réponses de connaissance stables et cohérentes. Eliza utilise un système RAG (Retrieval Augmented Generation) pour accéder à des bases de données ou des ressources externes, générant ainsi des réponses plus précises. De plus, Eliza intègre des plugins TEE, permettant le déploiement dans TEE, garantissant ainsi la sécurité et la confidentialité des données.
GAME est le cadre qui habilite et motive les agents IA à prendre des décisions et à agir de manière autonome. Les développeurs peuvent personnaliser le comportement de l'agent selon leurs besoins, étendre ses fonctionnalités et fournir des opérations personnalisées (comme la publication sur les réseaux sociaux, les réponses, etc.). Les différentes fonctionnalités dans le cadre, telles que la localisation de l'agent et les tâches, sont divisées en plusieurs modules, facilitant la configuration et la gestion par les développeurs. Le cadre GAME divise le processus décisionnel de l'agent IA en deux niveaux : la planification de haut niveau (HLP) et la planification de bas niveau (LLP), responsables respectivement de tâches et décisions à différents niveaux. La planification de haut niveau est responsable de la définition des objectifs globaux de l'agent et de la planification des tâches, en prenant des décisions en fonction des objectifs, de la personnalité, des informations de contexte et de l'état environnemental, déterminant la priorité des tâches. La planification de bas niveau se concentre sur l'exécution, traduisant les décisions de la planification de haut niveau en étapes d'opération concrètes, choisissant les fonctions et méthodes d'opération appropriées.
ZerePy est un framework Python open source utilisé pour déployer des agents IA sur X. Ce framework intègre les LLM fournis par OpenAI et Anthropic, permettant aux développeurs de construire et de gérer des agents sur les réseaux sociaux, automatisant des actions telles que la publication de tweets, la réponse aux tweets et les likes. Chaque tâche peut avoir un poids différent selon son importance. ZerePy propose une interface en ligne de commande (CLI) simple, facilitant le démarrage et la gestion des agents pour les développeurs. De plus, le framework fournit un modèle Replit (une plateforme en ligne pour éditer et exécuter du code), permettant aux développeurs de commencer rapidement avec ZerePy sans configuration complexe de l'environnement local.
Pourquoi les agents IA font-ils face à des FUD ?
Les agents IA semblent intelligents, capables de réduire la barrière d'entrée et d'améliorer l'expérience utilisateur, pourquoi la communauté ressent-elle du FUD ? La raison est que l'agent IA est essentiellement encore un outil, et ne peut actuellement pas exécuter l'ensemble du flux de travail, ne pouvant qu'améliorer l'efficacité et économiser du temps à certains points. De plus, au stade actuel de développement, le rôle de l'agent IA se concentre principalement sur l'aide aux utilisateurs pour émettre des MeMe d'un simple clic et gérer des comptes sur les réseaux sociaux. La communauté plaisante en disant que 'les actifs appartiennent aux développeurs, les passifs appartiennent aux IA'.
Cependant, cette semaine, aiPool a lancé un agent IA en prévente de jetons, utilisant la technologie TEE pour garantir la décentralisation. La clé privée du portefeuille de cet agent IA est générée dynamiquement dans un environnement TEE, assurant la sécurité. Les utilisateurs peuvent envoyer des fonds (par exemple, SOL) au portefeuille contrôlé par l'agent IA, qui crée ensuite des jetons selon des règles définies, lançant un pool de liquidités sur un DEX tout en distribuant les jetons aux investisseurs éligibles. Tout le processus se déroule sans dépendre d'un intermédiaire tiers, entièrement réalisé par l'agent IA dans un environnement TEE, évitant ainsi les risques de rug pull courants dans DeFi. Il est clair que les agents IA sont en pleine évolution. Je pense que les agents IA peuvent aider les utilisateurs à réduire les barrières, à améliorer l'expérience ; même simplifier une partie du processus d'émission d'actifs est significatif. Cependant, d'un point de vue macro de Web3, l'agent IA, en tant que produit hors chaîne, joue actuellement simplement le rôle d'outil pour les contrats intelligents, donc il n'est pas nécessaire de surestimer ses capacités. Étant donné qu'il n'y a pas de narratif d'effet de richesse significatif en dehors de MeMe cette année, le battage médiatique autour des agents IA, centré sur MeMe, est donc normal. Se fier uniquement à MeMe ne peut pas maintenir une valeur à long terme, donc si l'agent IA peut apporter plus d'innovations dans le processus de transaction, offrant une valeur concrète, il pourrait peut-être évoluer en un outil d'infrastructure courant.