rounded

Rédigé par : 0XNATALIE

Depuis le début de la seconde moitié de cette année, le sujet des Agents IA a continué à gagner en popularité. Au départ, le chatbot IA terminal of truths a attiré l'attention en raison de ses publications et réponses humoristiques sur X (similaires à « Robert » sur Weibo) et a reçu un financement de 50 000 dollars de Marc Andreessen, le fondateur d'a16z. Inspirés par son contenu, certains ont créé le token GOAT, qui a connu une augmentation de plus de 10 000 % en seulement 24 heures. Le sujet des Agents IA a rapidement attiré l'attention de la communauté Web3. Par la suite, le premier fonds de trading AI décentralisé basé sur Solana, ai16z, a été lancé, introduisant le cadre de développement d'Agents IA Eliza et déclenchant une lutte pour les tokens en majuscules et en minuscules. Cependant, la communauté ne comprend toujours pas clairement le concept d'Agent IA : quel est vraiment le cœur de l'Agent IA ? En quoi est-il différent d'un robot de trading Telegram ?

Fonctionnement : perception, raisonnement et décision autonome

L'Agent IA est un système d'agent intelligent basé sur un modèle de langage de grande taille (LLM), capable de percevoir l'environnement, de prendre des décisions par raisonnement, et d'exécuter des tâches complexes en appelant des outils ou en réalisant des actions. Flux de travail : module de perception (obtenir des entrées) → LLM (compréhension, raisonnement et planification) → appel d'outils (exécution des tâches) → retour et optimisation (validation et ajustement).

Concrètement, l'Agent IA commence par obtenir des données de l'environnement extérieur (comme du texte, de l'audio, des images, etc.) via le module de perception, et les transforme en informations structurées pouvant être traitées. Le LLM, en tant que composant central, offre de puissantes capacités de compréhension et de génération de langage naturel, agissant comme le « cerveau » du système. Basé sur les données d'entrée et les connaissances existantes, le LLM effectue un raisonnement logique, générant des solutions possibles ou élaborant un plan d'action. Ensuite, l'Agent IA accomplit des tâches spécifiques en appelant des outils externes, des plugins ou des API, et valide et ajuste les résultats en fonction des retours, formant un cycle d'optimisation.

Dans les scénarios d'application Web3, quelle est la différence entre l'Agent IA et un robot de trading Telegram ou un script d'automatisation ? Prenons l'arbitrage comme exemple, l'utilisateur souhaite effectuer un échange d'arbitrage lorsque le profit est supérieur à 1 %. Dans un robot de trading Telegram prenant en charge l'arbitrage, l'utilisateur configure une stratégie de trading où le profit doit être supérieur à 1 %, et le bot commence à exécuter. Cependant, lorsque le marché fluctue fréquemment et que les opportunités d'arbitrage changent constamment, ces bots manquent de capacité d'évaluation des risques et exécutent simplement l'arbitrage dès que la condition de profit supérieur à 1 % est remplie. En revanche, l'Agent IA peut ajuster automatiquement sa stratégie. Par exemple, si le profit d'une transaction dépasse 1 %, mais que l'analyse des données évalue son risque comme étant trop élevé, et que le marché peut soudainement changer entraînant une perte, il décidera de ne pas exécuter cet arbitrage.

Ainsi, l'Agent IA possède une auto-adaptabilité, sa principale force résidant dans sa capacité à apprendre par lui-même et à prendre des décisions autonomes. Grâce à l'interaction avec l'environnement (comme le marché, le comportement des utilisateurs, etc.), il ajuste sa stratégie comportementale en fonction des signaux de retour, améliorant continuellement l'efficacité de l'exécution des tâches. Il peut également prendre des décisions en temps réel basées sur des données externes et optimiser sans cesse sa stratégie décisionnelle grâce à l'apprentissage par renforcement.

Cela ressemble-t-il un peu à un solveur dans un cadre d'intention ? L'Agent IA lui-même est également un produit basé sur l'intention, la principale différence avec le solveur dans un cadre d'intention étant que le solveur repose sur des algorithmes précis, avec une rigueur mathématique, tandis que les décisions de l'Agent IA dépendent de l'entraînement des données, nécessitant souvent un processus d'essai-erreur pour s'approcher de la solution optimale.

Cadres principaux des Agents IA

Le cadre de l'Agent IA est l'infrastructure utilisée pour créer et gérer des agents intelligents. Actuellement, dans Web3, les cadres populaires incluent Eliza d'ai16z, ZerePy de zerebro et GAME de Virtuals.

Eliza est un cadre d'Agent IA multifonctionnel, construit avec TypeScript, qui prend en charge l'exécution sur plusieurs plateformes (comme Discord, Twitter, Telegram, etc.) et grâce à une gestion complexe de la mémoire, il peut se souvenir des conversations et du contexte précédents, maintenant des caractéristiques de personnalité et des réponses de connaissance stables et cohérentes. Eliza utilise un système RAG (Retrieval Augmented Generation), capable d'accéder à des bases de données externes ou des ressources, générant ainsi des réponses plus précises. De plus, Eliza intègre un plugin TEE, permettant le déploiement dans un TEE, garantissant ainsi la sécurité et la confidentialité des données.

GAME est le cadre qui permet et motive l'Agent IA à prendre des décisions autonomes et à agir. Les développeurs peuvent personnaliser le comportement de l'agent selon leurs besoins, étendre ses fonctionnalités et fournir des opérations personnalisées (comme des publications sur les réseaux sociaux, des réponses, etc.). Les différentes fonctions dans le cadre, comme l'emplacement de l'agent dans l'environnement et les tâches, sont divisées en plusieurs modules, facilitant la configuration et la gestion par les développeurs. Le cadre GAME divise le processus décisionnel de l'Agent IA en deux niveaux : la planification de haut niveau (HLP) et la planification de bas niveau (LLP), responsables de différentes tâches et décisions. La planification de haut niveau fixe les objectifs généraux et la planification des tâches de l'agent, établissant des décisions basées sur les objectifs, la personnalité, les informations contextuelles et l'état de l'environnement, déterminant les priorités des tâches. La planification de bas niveau se concentre sur l'exécution, transformant les décisions de la planification de haut niveau en étapes d'action concrètes, choisissant les fonctions et méthodes d'opération appropriées.

ZerePy est un cadre Python open source utilisé pour déployer des Agents IA sur X. Ce cadre intègre des LLM fournis par OpenAI et Anthropic, permettant aux développeurs de construire et de gérer des agents de médias sociaux, automatisant des opérations telles que la publication de tweets, les réponses aux tweets, les likes, etc. Chaque tâche peut être pondérée selon son importance. ZerePy propose une interface en ligne de commande (CLI) simple, facilitant le démarrage rapide et la gestion des agents par les développeurs. De plus, le cadre propose un modèle Replit (une plateforme en ligne d'édition et d'exécution de code), permettant aux développeurs de commencer rapidement à utiliser ZerePy sans configuration complexe d'environnement local.

Pourquoi l'Agent IA fait-il face à du FUD ?

L'Agent IA semble intelligent, capable de réduire les barrières d'entrée et d'améliorer l'expérience utilisateur, pourquoi la communauté éprouve-t-elle du FUD ? La raison en est que l'Agent IA est essentiellement encore un outil, et ne peut pas encore accomplir l'ensemble du flux de travail, ne pouvant améliorer l'efficacité et économiser du temps qu'à certains points. De plus, à ce stade de développement, le rôle de l'Agent IA se concentre beaucoup sur l'aide aux utilisateurs pour émettre des MeMe d'un simple clic et gérer des comptes de médias sociaux. La communauté plaisante en disant « les actifs appartiennent aux développeurs, les passifs appartiennent à l'IA ».

Cependant, cette semaine, aiPool a lancé un Agent IA en prévente de tokens, utilisant la technologie TEE pour réaliser une décentralisation de confiance. La clé privée du portefeuille de cet Agent IA est générée dynamiquement dans un environnement TEE, assurant la sécurité. Les utilisateurs peuvent envoyer des fonds (par exemple SOL) au portefeuille contrôlé par l'Agent IA, qui crée des tokens selon des règles établies et lance un pool de liquidité sur DEX, tout en distribuant des tokens aux investisseurs éligibles. L'ensemble du processus ne dépend d'aucun intermédiaire tiers, étant entièrement réalisé par l'Agent IA dans un environnement TEE, évitant ainsi les risques de rug pull courants dans la DeFi. Il est clair que l'Agent IA évolue progressivement. Je pense que l'Agent IA peut aider les utilisateurs à abaisser les barrières d'entrée et à améliorer l'expérience, même simplifier une partie du processus d'émission d'actifs est significatif. Mais d'un point de vue macro sur Web3, l'Agent IA en tant que produit hors chaîne n'est actuellement qu'un outil d'assistance pour les contrats intelligents, donc il n'est pas nécessaire de surestimer ses capacités. Étant donné qu'il n'y a pas de narration significative de l'effet de richesse à part MeMe cette seconde moitié de l'année, le battage médiatique autour de l'Agent IA qui s'est développé autour de MeMe est normal. S'appuyer uniquement sur MeMe ne peut pas maintenir une valeur à long terme, donc si l'Agent IA peut apporter davantage d'innovations dans le processus de trading, fournissant une valeur concrète, il pourrait évoluer vers un outil infra courant.