Source de l'image : (深潮 TechFlow)
Après de nombreuses attentes, Eliza a enfin publié son livre blanc aujourd'hui.
Bien que nous entendions souvent que de nombreux agents AI sont fabriqués sur la base de l'architecture open-source d'Eliza, l'absence d'une définition technique détaillée et sérieuse de ce que cela signifie pour Eliza reste une lacune.
Ce livre blanc est une excellente réponse, décrivant comment Eliza permet une profonde intégration de l'AI et du Web3, le design d'une architecture système modulaire et les détails techniques de sa mise en œuvre en tant qu'architecture open-source.
Le livre blanc a été coécrit par Shaw, plusieurs membres d'Eliza Labs et des techniciens d'autres organisations connexes, mais en raison de la quantité de détails techniques et de concepts spécialisés, il peut ne pas être très accessible aux lecteurs ordinaires.
深潮 TechFlow a simplifié et distillé cela pour que tout le monde puisse comprendre rapidement le contenu de ce livre blanc avec un langage accessible.
Source de l'image : (深潮 TechFlow)
Pourquoi créer Eliza ?
Attention, l'éditeur pense que le préambule de la réflexion est de délimiter le champ - c'est-à-dire dans l'industrie de la cryptographie ou du Web3, pourquoi faire Eliza, et non pas comparer cette architecture avec d'autres architectures AI de plus grande envergure.
En suivant cette ligne de pensée, l'introduction et le contexte du livre blanc répondent en réalité très bien à cette question :
Dans l'industrie croisée entre AI et Web3, il existe un vide évident : le manque d'une architecture d'agent capable d'intégrer parfaitement les applications Web3.
Source de l'image : (深潮 TechFlow)
Plus précisément, le livre blanc estime que l'industrie Web3 fait face à trois défis principaux :
Complexité des transactions décentralisées. Avec le développement florissant d'Ethereum, Solana, BASE et d'autres chaînes publiques, la gestion des actifs et l'exécution des transactions sur différentes chaînes deviennent de plus en plus difficiles. Bien qu'il existe déjà certaines plateformes de trading, pour les utilisateurs de niveau intermédiaire à avancé ayant des besoins personnalisés, les fonctionnalités de base de ces plateformes sont souvent insuffisantes.
Extraction de valeur des données sur la chaîne. La blockchain contient une quantité massive d'informations précieuses, allant des variations d'adresses de détention de jetons, des prix des jetons, de la capitalisation boursière et d'autres indicateurs de base, à des indicateurs avancés tels que la part des comptes de baleines et le style des teneurs de marché. Comment transformer efficacement ces données complexes en informations précieuses est un problème urgent à résoudre.
Fragmentation des informations sur les réseaux sociaux. Pour l'industrie Web3, des plateformes sociales comme X, Discord, Farcaster sont des canaux importants pour obtenir des informations. Mais avec l'augmentation du nombre d'influenceurs (KOL), les informations deviennent de plus en plus fragmentées, et comment obtenir des insights précieux dans un déluge d'informations devient un défi commun pour chaque trader.
C'est précisément sur la base de ces besoins réels qu'Eliza a vu le jour. En tant que premier système d'exploitation d'agent AI open source convivial pour le Web3, Eliza adopte une conception modulaire, permettant aux développeurs et aux utilisateurs de personnaliser des solutions selon leurs besoins.
Eliza tente de réduire le seuil d'accès des utilisateurs ordinaires aux fonctionnalités AI avancées, permettant de construire leur propre agent AI sans nécessiter de solides compétences en programmation.
En même temps, le livre blanc a également comparé ses propres caractéristiques à celles d'autres architectures AI courantes, le tableau ci-dessous montre de manière intuitive qu'en termes de support Web3, Eliza se proclame comme le mieux adapté, ce qui est le point clé que le livre blanc souhaite transmettre.
Source de l'image : (深潮 TechFlow)
Philosophie de conception et innovations techniques d'Eliza.
Trois grands principes de conception : simple mais pas simpliste.
Le succès d'Eliza n'est pas un hasard. Dès la conception, l'équipe a établi trois principes fondamentaux :
1. Priorité aux développeurs Web3 Étant donné que le Web3 est principalement développé en JavaScript/TypeScript, Eliza a choisi TypeScript comme langage de développement. Cela permet non seulement aux développeurs d'utiliser des outils familiers, mais leur permet également d'intégrer facilement des fonctionnalités blockchain dans leurs applications web existantes. En d'autres termes, cela permet aux développeurs Web3 d'être ‘prêts à l'emploi’.
2. Conception d'applications modulaires Eliza décompose le système en un cœur d'exécution et quatre composants clés :
Adaptateur(數據適配器)
Personnage(代理个性)
Client(消息互动)
Plugin(通用功能)
Ce design permet aux développeurs d'ajouter librement leurs propres applications, clients, personnages et adaptateurs, sans se soucier des détails du cœur d'exécution. Cela permet également à Eliza de prendre en charge le plus large éventail de fournisseurs de modèles (comme OpenAI, Llama, Qwen, etc.), d'intégrations de plateformes (X, Discord, Telegram, etc.) et de compatibilité de chaînes (Solana, Ethereum, Ton, etc.).
3. Préférer la simplicité à la complexité :
Avec des ressources d'ingénierie limitées, maintenir une mise en œuvre interne simple peut économiser du temps pour le développement de nouvelles fonctionnalités, s'adapter à de nouveaux scénarios et suivre le rythme du développement rapide des industries AI et Web3.
Innovation technique : harmonisation interne et externe.
En termes de mise en œuvre concrète, l'innovation d'Eliza est divisée en deux dimensions : amélioration interne et extension externe.
1. Amélioration interne Pour améliorer la capacité de réflexion du modèle AI, Eliza intègre plusieurs technologies de pointe :
Chaîne de pensées(思維鏈) :
Définition technique : introduire des explications étape par étape.
Compréhension populaire : tout comme résoudre des problèmes mathématiques nécessite d'écrire le processus, l'AI écrira également son processus de réflexion étape par étape, au lieu de donner directement la réponse. Cela rend non seulement le résultat plus précis, mais permet également aux humains de comprendre comment l'AI est parvenue à sa conclusion.
Arbre de pensées(思維樹) :
Définition technique : permettre l'exploration de plusieurs solutions.
Compréhension populaire : tout comme lorsque l'on joue aux échecs, il faut considérer plusieurs coups possibles, l'AI explorera simultanément plusieurs solutions, puis choisira la meilleure. C'est comme choisir la meilleure branche sur l'arbre de la pensée.
Graphique des pensées(思維圖) :
Définition technique : connecter les chemins de raisonnement.
Compréhension populaire : considérer le problème comme un réseau, où différentes idées sont interconnectées. Tout comme lorsque nous résolvons des problèmes complexes, nous relions diverses idées connexes pour former une carte conceptuelle.
Couche de pensées(思維層) :
Définition technique : raisonnement AI par niveaux.
Compréhension populaire : comme un filtre, diviser le processus de pensée en différentes couches. Tout comme lorsque nous résolvons un problème, nous commençons par les grandes lignes avant de détailler les détails spécifiques, en progressant étape par étape.
2. Fonctionnalités d'extension externes. Pour améliorer la capacité de résoudre des problèmes pratiques, Eliza intègre divers capacités externes :
RAG (génération améliorée par récupération) :
Définition technique : améliorer les capacités de génération par récupération.
Compréhension populaire : tout comme un étudiant peut consulter un manuel lors de ses devoirs, l'AI peut également consulter sa ‘base de données’ lorsqu'elle répond à des questions, garantissant des réponses plus précises.
Base de données vectorielle :
Définition technique : stocker et récupérer des données structurées.
Compréhension populaire : équivalent à la « bibliothèque » de l'AI, capable de trouver rapidement des contenus similaires. Par exemple, si vous dites « Je veux trouver un poème sur la lune », il peut rapidement trouver tous les poèmes pertinents.
Recherche sur Internet :
Définition technique : obtenir des informations sur le réseau en temps réel.
Compréhension populaire : permettre à l'AI de rechercher les dernières informations sur internet comme un humain, sans être limité à une gamme de connaissances fixe.
Conversion de texte en image, vidéo, modèles 3D :
Définition technique : convertir des descriptions textuelles en contenu multimédia.
Compréhension populaire : tout comme un artiste peut peindre une œuvre à partir d'une description textuelle, l'AI peut générer des images, des vidéos, et même des modèles 3D à partir de votre description.
Comparaison avec d'autres architectures de l'industrie Web3.
Dans l'architecture actuelle des agents AI Web3, Eliza montre des avantages évidents. Selon les retours de plus de 50 chercheurs en AI et développeurs blockchain expérimentés, Eliza surpasse d'autres architectures sur plusieurs indicateurs clés.
Niveau de support des fournisseurs de modèles.
État de compatibilité des chaînes.
État de l'intégrité fonctionnelle.
État de l'intégration des médias sociaux.
Source de l'image : (深潮 TechFlow)
Eliza OS : un écosystème AI Web3 soigneusement conçu.
Après avoir compris la philosophie de conception d'Eliza, examinons comment cette architecture fonctionne réellement. On peut envisager Eliza comme un système de blocs LEGO soigneusement conçu, chaque partie pouvant s'assembler parfaitement tout en conservant une grande flexibilité.
Composants clés : cinq rôles essentiels.
Dans le monde d'Eliza, cinq composants clés interagissent pour constituer un système d'intelligence complet.
1. Agents(代理) : les protagonistes du système.
Ils sont comme des ‘assistants numériques’ indépendants, responsables de diverses interactions autonomes. Chaque agent possède sa propre ‘mémoire’ et ‘personnalité’, capable d'avoir des conversations et des interactions cohérentes avec les utilisateurs à travers différents canaux comme Discord, X, etc.
2. Fichiers de caractère(角色配置) : la ‘personnalité’ de l'agent.
Pour donner à ces agents une personnalité, le support des Fichiers de caractère(角色配置) est nécessaire. Cela équivaut au ‘CV’ de l'agent, définissant non seulement son identité et ses caractéristiques de personnalité, mais stipulant également quels modèles il peut utiliser (comme OpenAI, Anthropic), ainsi que les opérations qu'il peut exécuter (comme les transactions blockchain, le minting de NFT). Grâce à une configuration de personnage soigneusement conçue, chaque agent peut afficher des spécialités et des comportements professionnels uniques.
3. Fournisseurs(提供者) : le « système de perception » de l'agent.
Lors des interactions avec le monde extérieur, l'agent a besoin de Fournisseurs (提供者) comme son ‘système de perception’. Tout comme les humains ont besoin de sens pour percevoir le monde, les fournisseurs fournissent à l'agent des données de marché, des détails de portefeuille, des analyses d'humeur et d'autres informations en temps réel pour l'aider à mieux comprendre l'environnement et le contexte actuel.
4. Actions(行動) : la ‘bibliothèque de compétences’ de l'agent.
Lorsqu'une action concrète est nécessaire, les Actions (行動) deviennent la « bibliothèque de compétences » de l'agent. De simples ordres d'achat et de vente à la génération complexe de NFT, chaque opération est soumise à des vérifications de sécurité strictes pour garantir une exécution sans faille lors du traitement des tâches financières. Ces compétences permettent à l'agent de jouer un rôle réel dans le monde du Web3.
5. Évaluateurs(評估器) : le ‘système de décision’ de l'agent.
Enfin, les Évaluateurs(評估器) servent de ‘système décisionnel’ pour l'agent, responsables d'évaluer le contenu des dialogues, d'extraire des informations importantes et d'aider l'agent à établir une mémoire à long terme. Ils ne suivent pas seulement les progrès vers l'accomplissement des objectifs, mais garantissent également la cohérence de l'ensemble du processus de dialogue.
Interactions intelligentes : pas seulement des dialogues simples.
En termes d'interaction, Eliza utilise un système de compréhension multilayer, semblable à un traducteur expérimenté, qui doit non seulement comprendre le sens littéral, mais aussi le contexte et l'intention de la parole. Ce système est capable de comprendre avec précision les véritables besoins de l'utilisateur, de maintenir une expérience cohérente sur différentes plateformes de communication et d'ajuster ses réponses de manière flexible en fonction du contexte.
Source de l'image : (深潮 TechFlow)
Système d'applications extensibles : possibilités d'extension infinies.
Le système d'applications extensibles d'Eliza est essentiellement une boîte à outils, apportant une forte extensibilité à l'ensemble de l'architecture, cette extensibilité se manifestant dans trois directions : génération multimédia, intégration Web3 et infrastructures.
En termes de génération multimédia, il est capable de créer des images, des vidéos, des modèles 3D, prenant en charge la génération automatique de séries NFT, tout en fournissant des capacités de description et d'analyse d'images.
En ce qui concerne l'intégration Web3, il prend en charge les opérations multi-chaînes telles qu'Ethereum, Solana, offrant un ensemble complet de fonctionnalités de transaction et intégrant divers opérations DeFi.
Concernant les infrastructures, il fournit des capacités de base telles que des services de navigateur, le traitement de documents, la conversion de la voix en texte, etc.
Grâce à cette conception modulaire, Eliza maintient non seulement la stabilité du système, mais offre également aux développeurs des possibilités d'extension presque infinies. Cela permet également à Eliza de s'adapter aux nouvelles demandes et scénarios émergents dans le monde du Web3.
Quelle est la puissance d'Eliza ? Découvrons la vérité à partir des données.
Lorsqu'une nouvelle architecture technique apparaît, ce qui préoccupe souvent le plus les gens, c'est sa performance réelle. Eliza fournit une réponse honnête à cet égard.
Dans les tests de référence GAIA (une plateforme spécialement conçue pour évaluer la capacité des agents AI à résoudre des problèmes réels), Eliza a démontré de solides compétences. Ce test ne se limite pas à évaluer des capacités simples de question-réponse, mais exige que l'agent AI possède des compétences en raisonnement logique, traitement multimodal, navigation web et utilisation d'outils.
Bien que lors des tests, le score d'Eliza (19,42 %) soit encore loin des meilleures solutions actuelles, compte tenu qu'il s'agit d'une architecture axée sur l'industrie Web3, ce résultat est déjà assez impressionnant. En particulier dans le traitement des tâches de base (Niveau 1), Eliza a atteint un taux d'achèvement de 32,21 %, montrant ainsi sa solide capacité de base.
Source de l'image : (深潮 TechFlow)
Industrie Web3 : pionnier des standards.
De plus, il est intéressant de noter qu'Eliza joue en réalité un rôle de ‘pionnier des standards’ dans l'industrie Web3. Étant donné que les systèmes AI orientés Web3 en sont encore à leurs débuts, Eliza a été la première à proposer un cadre complet d'évaluation standard, indiquant la direction de développement pour toute l'industrie.
Ce système d'évaluation se compose de trois niveaux, que le livre blanc appelle le ‘test de Turing’ pour la version Web3 AI :
Capacités de base : y compris la création de portefeuilles, les transactions de jetons, les interactions avec des contrats intelligents et autres opérations de base.
Fonctionnalités avancées : intégration des dernières technologies AI, telles que la conversion de texte en vidéo/3D, le support RAG, etc.
Caractéristiques avancées : capacité à planifier et raisonner de manière autonome sur la base des instructions de l'utilisateur, réalisant ainsi une véritable prise de décision intelligente.
Actuellement, Eliza a réussi à réaliser toutes les fonctionnalités de base et avance vers des niveaux avancés. L'équipe déclare qu'elle est convaincue que dans les prochaines années, elle pourra réaliser un système d'agent AI totalement autonome.
Source de l'image : (深潮 TechFlow)
Application pratique : le marché vote avec de l'argent réel.
Le livre blanc original contient une section sur la démonstration de code, destinée à illustrer les applications pratiques qui peuvent être réalisées avec cette architecture ; en raison de la difficulté de compréhension et des détails techniques, nous l'omettons ici, montrant uniquement un aperçu plus général de la situation économique réelle.
Selon le livre blanc, d'ici janvier 2025, plusieurs projets Web3 importants auront construit leurs systèmes d'agent AI sur la base d'Eliza, avec une capitalisation boursière totale de plus de 20 milliards de dollars.
Source de l'image : (深潮 TechFlow)
Ce chiffre numérique est peut-être la meilleure validation des capacités techniques d'Eliza par le marché.
Plus important encore, l'équipe d'Eliza est pleine de confiance pour l'avenir. Ils croient qu'avec l'évolution continue de ces « agents intelligents », nous entrerons dans une nouvelle ère où plusieurs unités AI travailleront en collaboration. Comme l'a dit Dario Amodei, le PDG d'Anthropic, dans sa vision du « centre de données géniaux », Eliza pave le chemin pour cet avenir.
Limitations existantes et perspectives futures : une auto-analyse sincère.
Aucune architecture technique ne peut être parfaite, l'équipe d'Eliza admet également dans le livre blanc les limites actuelles de l'architecture.
Trois grands défis à résoudre.
Absence de systèmes de flux de travail : tout comme un assistant compétent a besoin d'un ensemble de processus de travail standardisés, lorsque les développeurs souhaitent réaliser certaines tâches récurrentes (par exemple, rassembler des données de plusieurs sources régulièrement), l'architecture actuelle d'Eliza ne peut pas encore fournir de solutions prêtes à l'emploi. Pour ce type de demande, il peut encore être nécessaire de recourir à des systèmes de flux de travail dotés d'interfaces graphiques comme Dify ou Coze.
Problèmes de performance des systèmes multi-agents. Avec l'augmentation du nombre d'agents, le contexte et le contenu de mémoire que le système doit gérer croissent de manière exponentielle. En particulier lors du traitement de nombreuses tâches d'entrée et de sortie, comment équilibrer les coûts de calcul et l'efficacité opérationnelle reste un défi technique à résoudre.
Besoins d'expansion pour le support multilingue. Actuellement, Eliza est principalement basé sur TypeScript, mais pour attirer davantage de développeurs d'autres industries, il est nécessaire d'étendre le support pour d'autres langages de programmation comme Python, Rust, etc.
Perspectives : ouvrir une nouvelle ère d'AI décentralisée.
Malgré ces limitations, l'importance d'Eliza va bien au-delà d'une simple architecture technique. Elle représente une tentative pionnière de fusion profonde entre la technologie AI et les applications Web3.
En concevant chaque module fonctionnel comme un programme standard TypeScript, Eliza garantit aux utilisateurs un contrôle total sur le système. En même temps, il offre également une capacité d'intégration transparente avec les données de la blockchain et les contrats intelligents. Ce design assure à la fois la sécurité et maintient une grande extensibilité.
Comme le dit la conclusion du livre blanc, les possibilités d'Eliza ne sont limitées que par l'imagination de l'utilisateur. Avec l'évolution continue des technologies AI et Web3, Eliza continuera à se développer et à mener la direction du développement de l'AI décentralisée.
Cet article est reproduit avec autorisation de : (深潮 TechFlow)
Auteur de l'article original : (深潮 TechFlow)
‘Plusieurs agents AI adoptés ! Publication du livre blanc d'Eliza : explication des 3 grands principes et des 5 composants clés.’ Cet article a été publié pour la première fois sur ‘Crypto City’.