Auteur : 0XNATALIE
Depuis le deuxième semestre de cette année, le sujet des agents IA a continué à gagner en popularité. Au début, le robot de chat IA 'terminal of truths' a attiré beaucoup d'attention grâce à ses publications et réponses humoristiques sur X (similaires à 'Robert' sur Weibo) et a reçu un financement de 50 000 $ de Marc Andreessen, fondateur d'a16z. Inspirés par son contenu publié, des personnes ont créé le token GOAT, qui a augmenté de plus de 10 000 % en seulement 24 heures. Le sujet des agents IA a ensuite suscité l'intérêt de la communauté Web3. Par la suite, le premier fonds de trading IA décentralisé basé sur Solana, ai16z, a été lancé, introduisant le cadre de développement d'agents IA Eliza, et provoquant une bataille de tokens. Cependant, la communauté n'a toujours pas une idée claire du concept d'agent IA : quel est le cœur de l'agent IA ? En quoi est-il différent des robots de trading Telegram ?
Principe de fonctionnement : perception, raisonnement et prise de décision autonome
L'agent IA est un système d'agent intelligent basé sur des modèles de langage de grande taille (LLM), capable de percevoir l'environnement, de prendre des décisions par raisonnement, et d'accomplir des tâches complexes en appelant des outils ou en exécutant des opérations. Flux de travail : module de perception (obtenir des entrées) → LLM (compréhension, raisonnement et planification) → appel d'outils (exécution des tâches) → retour d'information et optimisation (validation et ajustement).
Concrètement, l'agent IA acquiert d'abord des données de l'environnement extérieur (comme du texte, de l'audio, des images, etc.) via le module de perception et les transforme en informations structurées pouvant être traitées. Le LLM, en tant que composant central, fournit une capacité puissante de compréhension et de génération de langage naturel, agissant comme le 'cerveau' du système. Sur la base des données d'entrée et des connaissances existantes, le LLM effectue un raisonnement logique, génère des solutions possibles ou établit des plans d'action. Ensuite, l'agent IA accomplit des tâches spécifiques en appelant des outils externes, des plugins ou des API, et vérifie et ajuste les résultats en fonction des retours, formant ainsi une optimisation en boucle fermée.
Dans le cadre des applications Web3, en quoi l'agent IA diffère-t-il des robots de trading Telegram ou des scripts automatisés ? Prenons l'arbitrage comme exemple, les utilisateurs souhaitent effectuer des transactions d'arbitrage lorsque le profit est supérieur à 1 %. Dans les robots de trading Telegram qui supportent l'arbitrage, les utilisateurs définissent une stratégie de trading avec un profit supérieur à 1 %, et le bot commence à exécuter. Cependant, lorsque le marché est très volatil et que les opportunités d'arbitrage changent constamment, ces bots manquent de capacité d'évaluation des risques ; dès que la condition de profit supérieur à 1 % est remplie, l'arbitrage est exécuté. En revanche, l'agent IA peut ajuster automatiquement sa stratégie. Par exemple, lorsqu'un certain trade génère un profit supérieur à 1 %, mais qu'une analyse de données évalue le risque comme trop élevé, le marché pourrait soudainement changer et entraîner des pertes, il décidera de ne pas exécuter cet arbitrage.
Ainsi, l'agent IA possède une auto-adaptabilité, son principal avantage étant sa capacité à apprendre de manière autonome et à prendre des décisions, en interagissant avec l'environnement (comme le marché, le comportement des utilisateurs, etc.) et en ajustant sa stratégie comportementale en fonction des signaux de retour, améliorant ainsi continuellement l'efficacité de l'exécution des tâches. Il peut également prendre des décisions en temps réel sur la base de données externes et optimiser continuellement sa stratégie décisionnelle par apprentissage par renforcement.
Dit comme ça, cela ressemble un peu à un solveur dans le cadre des intentions ? L'agent IA est également un produit basé sur les intentions, et la plus grande différence avec le solveur dans le cadre des intentions est que le solveur repose sur des algorithmes précis et possède une rigueur mathématique, tandis que la prise de décision de l'agent IA dépend de l'entraînement des données, nécessitant souvent un processus d'essai-erreur pour se rapprocher de la solution optimale.
Cadres principaux des agents IA
Le cadre des agents IA est l'infrastructure utilisée pour créer et gérer des agents intelligents. Actuellement, dans Web3, des cadres populaires incluent Eliza d'ai16z, ZerePy de zerebro et GAME de Virtuals.
Eliza est un cadre d'agent IA multifonctionnel, construit avec TypeScript, prenant en charge l'exécution sur plusieurs plateformes (comme Discord, Twitter, Telegram, etc.) et grâce à une gestion complexe de la mémoire, capable de se souvenir des conversations et du contexte précédents, maintenant des caractéristiques de personnalité et des réponses de connaissances stables et cohérentes. Eliza utilise un système RAG (Retrieval Augmented Generation), capable d'accéder à des bases de données ou ressources externes pour générer des réponses plus précises. De plus, Eliza intègre un plugin TEE, permettant le déploiement dans un TEE, garantissant ainsi la sécurité et la confidentialité des données.
GAME est le cadre qui habilite et stimule l'agent IA à prendre des décisions et des actions autonomes. Les développeurs peuvent personnaliser le comportement des agents selon leurs besoins, étendre leurs fonctionnalités et fournir des opérations sur mesure (comme publication sur les médias sociaux, réponses, etc.). Les différentes fonctionnalités dans le cadre, telles que l'emplacement de l'agent et les tâches, sont divisées en plusieurs modules, facilitant la configuration et la gestion pour les développeurs. Le cadre GAME divise le processus décisionnel de l'agent IA en deux niveaux : planification de haut niveau (HLP) et planification de bas niveau (LLP), responsables respectivement de différentes tâches et décisions. La planification de haut niveau est responsable de l'établissement des objectifs globaux et de la planification des tâches de l'agent, formulant des décisions basées sur les objectifs, la personnalité, les informations contextuelles et l'état de l'environnement, déterminant la priorité des tâches. La planification de bas niveau se concentre sur l'exécution, transformant les décisions de la planification de haut niveau en étapes d'opération concrètes, choisissant les fonctionnalités et méthodes d'opération appropriées.
ZerePy est un cadre Python open source utilisé pour déployer des agents IA sur X. Ce cadre intègre les LLM fournis par OpenAI et Anthropic, permettant aux développeurs de construire et de gérer des agents de médias sociaux, d'exécuter automatiquement des opérations telles que publier des tweets, répondre à des tweets, aimer, etc. Chaque tâche peut être pondérée différemment selon son importance. ZerePy offre une interface en ligne de commande (CLI) simple, facilitant le démarrage et la gestion rapides des agents pour les développeurs. De plus, le cadre fournit un modèle Replit (une plateforme de codage et d'exécution en ligne) permettant aux développeurs de commencer rapidement à utiliser ZerePy sans configuration complexe de l'environnement local.
Pourquoi l'agent IA fait-il face à des FUD ?
L'agent IA semble intelligent, capable de réduire la barrière d'entrée et d'améliorer l'expérience utilisateur. Pourquoi la communauté a-t-elle des FUD ? La raison réside dans le fait que l'agent IA est essentiellement encore un outil, ne pouvant pas réaliser l'ensemble du flux de travail, mais seulement améliorer l'efficacité et gagner du temps à certains nœuds. De plus, à ce stade de développement, le rôle de l'agent IA est principalement centré sur l'aide à l'utilisateur pour lancer MeMe en un clic et gérer des comptes de médias sociaux. La communauté le surnomme 'les actifs appartiennent aux développeurs, les passifs appartiennent à l'IA'.
Cependant, cette semaine, aiPool a lancé un agent IA en prévente de token, utilisant la technologie TEE pour réaliser une décentralisation. La clé privée du portefeuille de cet agent IA est générée dynamiquement dans un environnement TEE, garantissant la sécurité. Les utilisateurs peuvent envoyer des fonds (comme SOL) au portefeuille contrôlé par l'agent IA, qui crée ensuite des tokens selon des règles établies et lance un pool de liquidité sur DEX, tout en distribuant des tokens aux investisseurs éligibles. Le processus entier ne dépend d'aucun intermédiaire tiers et est entièrement exécuté par l'agent IA dans un environnement TEE, évitant ainsi le risque de rug pull courant dans le DeFi. Il est évident que l'agent IA est en cours de développement. Je pense que l'agent IA peut aider les utilisateurs à réduire la barrière d'entrée et à améliorer l'expérience, même si cela ne simplifie qu'une partie du processus d'émission d'actifs, cela a du sens. Cependant, d'un point de vue macro du Web3, l'agent IA, en tant que produit hors chaîne, ne joue actuellement qu'un rôle d'outil d'assistance pour les contrats intelligents, donc il n'est pas nécessaire de trop vanter ses capacités. En raison du manque de récit d'effet de richesse significatif en dehors de MeMe au second semestre de cette année, il est normal que le battage médiatique autour de l'agent IA se concentre sur MeMe. Se fier uniquement à MeMe ne peut pas maintenir une valeur à long terme, donc si l'agent IA peut apporter plus d'innovations dans le processus de transaction, fournissant une valeur réelle, il pourrait évoluer vers un outil infra universel.