Auteur : JW (Paix et tranquillité)
Compilation : Deep Tide TechFlow
Dans le domaine de la cryptographie, en particulier dans ces nouveaux domaines en plein essor, j'ai trouvé un phénomène très courant : beaucoup de gens, après avoir trouvé un « bon projet » et l'avoir vu se développer rapidement, deviennent souvent trop concentrés, ignorant d'autres possibilités. Bien que cela puisse apporter des bénéfices à court terme, si l'environnement extérieur change et que nous ne pouvons pas nous adapter à temps, cela pourrait poser problème.
Je pense que croire qu'un leader actuel d'un domaine émergent qui n'existe que depuis 4 mois peut maintenir sa position de leader à long terme est une idée trop naïve, surtout avec l'émergence de développeurs et de technologies supérieurs.
Cadre Pippin
Pippin est un cadre d'agent IA développé par @yoheinakajima, visant à aider les développeurs et créateurs à exploiter la technologie IA avancée de manière modulaire. Grâce à Pippin, les utilisateurs peuvent construire des assistants numériques capables d'accomplir des tâches de manière autonome, de générer de nouveaux plans et de collaborer sans effort avec des outils externes. En tant que projet open source, Pippin sera ouvert à l'utilisation mondiale dans les semaines à venir.
Voici un aperçu de la manière d'utiliser ce cadre, de la philosophie de conception et de l'esprit expérimental :
Origines philosophiques : Ce cadre est inspiré par le naturalisme pippinien, considérant l'IA comme une partie d'un écosystème numérique plus large. Il propulse le développement de l'IA à travers la mémoire, les contraintes et un sens des objectifs en constante évolution. Nous préconisons une philosophie de conception délicate : permettre à l'IA de découvrir de « petites merveilles » dans la vie, et d'apprendre et de grandir continuellement à travers le succès et l'échec.
Utilisation du processus : Lors de l'utilisation du cadre, il est d'abord nécessaire de définir un rôle, y compris sa personnalité, ses objectifs et ses contraintes. Ensuite, connectez le rôle à divers outils ou applications, appelés « compétences ». La boucle centrale du cadre surveille l'état de la mémoire du rôle, décide quelles activités doivent être exécutées et peut même générer de nouvelles activités en fonction des expériences réussies de l'IA ou des défis rencontrés.
Suivi de la mémoire et de l'état : Le cadre intègre un système de mémoire qui peut enregistrer les résultats de chaque activité et ajuster dynamiquement les variables d'état (comme l'énergie ou l'émotion). Cela signifie que les décisions futures de l'IA ne sont pas seulement déterminées par les contraintes, mais également influencées par les « expériences passées », tout comme un agent capable d'apprendre et de s'adapter progressivement.
Activités dynamiques : Ce cadre permet à l'IA d'élargir dynamiquement de nouvelles capacités, des tweets simples ou la génération d'images, jusqu'au déploiement de code avancé complexe. Étant donné que les compétences sont modulaires, les développeurs peuvent facilement ajouter ou désactiver des compétences spécifiques, permettant ainsi à l'IA de se concentrer sur certaines tâches ou d'élargir ses capacités lorsqu'une nouvelle opportunité se présente.
Nature expérimentale : Il s'agit d'un projet en cours d'optimisation, alors que les développeurs explorent constamment des méthodes efficaces, le cadre est également en perfectionnement. Bien que le cadre intègre certaines contraintes par défaut et un journal de mémoire pour guider le comportement de l'IA, les développeurs peuvent ajouter leurs propres mécanismes de protection ou fonctionnalités d'extension selon les besoins, afin de façonner de manière responsable les modèles de comportement de l'IA.
Applications potentielles : Le cadre a un large éventail d'applications, allant de la publication de contenu ou de l'exécution de tâches, au développement de systèmes d'enseignement interactifs, d'assistants marketing alimentés par l'IA, voire de robots DevOps capables de développement de code. Ces applications possèdent une personnalité en constante évolution, basées sur une capacité d'auto-réflexion et des principes de conception d'utilisation responsable, fournissant des solutions innovantes dans divers domaines.
Concepts et méthodes clés
En fusionnant des perspectives philosophiques et techniques, ce cadre offre aux développeurs les fonctionnalités clés suivantes :
Définition de rôle : Vous pouvez définir un rôle pour l'IA, comme un gardien sage ou une licorne pleine de fantaisie, et établir ses objectifs et contraintes. L'IA se référera à ces paramètres de rôle lors de l'exécution des tâches, tenant compte de ses objectifs et limitations personnalisés pour décider quoi « faire » et « comment le faire ».
Connexion d'outils (compétences) : Le cadre prend en charge la connexion de l'IA à des outils externes, tels que la blockchain, Slack ou des API personnalisées. Chaque outil existe en tant que module de « compétence » et prend en charge un contrôle flexible, garantissant que l'IA n'utilise que les outils que vous avez autorisés, maintenant ainsi la contrôlabilité et la concentration des tâches.
Génération d'activités : L'IA peut générer dynamiquement de nouveaux codes Python pour définir davantage d'activités à partir d'activités avancées. Cette méthode s'inspire du mécanisme de boucle itérative de BabyAGI, mais combine les caractéristiques personnalisées de l'IA et le journal de mémoire, rendant les activités générées plus adaptées aux paramètres de rôle et aux besoins réels.
Évolution de la mémoire : Le cadre intègre un système de mémoire qui enregistre les résultats de chaque activité et combine des notes à court terme avec une base de données à long terme. L'IA peut réfléchir sur ces mémoires, optimisant progressivement son comportement - non seulement capable de retenir quelles méthodes sont plus efficaces, mais aussi d'apprendre doucement de ses erreurs, fournissant des références pour les décisions futures.
Vous vous demandez peut-être : « JW, qu'est-ce qui distingue cela des autres cadres existants ? Pourquoi Pippin est-il si spécial ? »
Permettez-moi de vous présenter son contexte.
BabyAGI (base de Pippin)
BabyAGI est le premier projet d'agent IA open source de @yoheinakajima. À ce jour, il a obtenu 20 000 étoiles sur GitHub et a été cité par plus de 70 articles académiques. C'est l'un des cadres d'agents les plus influents à ce jour, dont la position reste inébranlable.
En fait, beaucoup de gens estiment que c'est BabyAGI qui a déclenché la vague de compétition dans le domaine des agents IA.
L'image originale est de @JW100x, compilée par Deep Tide TechFlow.
En résumé, BabyAGI est une étape importante dans l'industrie des agents IA, tandis que Pippin est une extension de BabyAGI. Il transforme BabyAGI en un cadre d'agents modulaire et sera disponible en tant que projet open source pour une utilisation mondiale à l'avenir. Pippin a le potentiel de devenir le cadre d'agents le plus avancé au monde, mais il est encore peu mentionné (ce qui est une manifestation de « vision étroite »).
Q&A avec Yohei
Récemment, j'ai eu plusieurs échanges intéressants avec @yoheinakajima. Il m'a permis de partager certaines de ses questions et réponses :
Yohei : « Au cours des deux dernières années, j'ai exploré une idée, celle de développer une IA capable de créer une entreprise de manière autonome. Bien que je ne sois pas sûr que les modèles d'IA actuels soient suffisants pour soutenir cet objectif, une fois que je serai convaincu qu'il peut se réaliser, je m'engagerai pleinement à construire un empire commercial. »
JW : « Le cadre Pippin jouera-t-il un rôle dans de tels projets ? »
Yohei : « :) Je pense que le cadre actuel peut être appliqué à n'importe quel domaine, cela dépend entièrement de la créativité des développeurs. »
Le potentiel du cadre Pippin est illimité. À mesure que la technologie des agents IA progresse, nous pourrions voir son rôle non seulement dans le domaine de la cryptographie, mais aussi dans divers secteurs à l'échelle mondiale, entraînant une transformation industrielle.
Problèmes des cadres existants
Lors de mes échanges avec certains développeurs d'IA, j'ai appris que les cadres existants (en particulier TypeScript) présentent de nombreux défis en pratique.
Un développeur qui a travaillé en étroite collaboration avec Eliza (ai16z) a mentionné : « Honnêtement, même si ElizaOS a acquis tous les concurrents, je déteste vraiment qu'il soit développé en TypeScript. Ce système est chargé de fonctionnalités encombrantes et de nombreux bogues, et ils sont toujours pressés de lancer trop de nouvelles fonctionnalités avant de résoudre les problèmes. »
C'est précisément à cause de ces problèmes que le marché a un besoin urgent de cadres plus efficaces et plus faciles à utiliser, ce qui constitue l'avantage du cadre Pippin. Grâce au code open source de BabyAGI, nous pouvons déjà entrevoir le potentiel futur du cadre Pippin.
En fait : « BabyAGI a été lancé au moment de la sortie de ChatGPT-4, c'est le premier cadre d'agents, on peut dire qu'il est à l'origine de la technologie des agents. Les créateurs de BabyAGI sont sans aucun doute de loin en avance sur AI16z. Je pense que le développement d'ElizaOS ressemble davantage à un transfert complet de cadre et qu'il dépassera presque certainement AI16z. Notre entreprise avait déjà utilisé BabyAGI en interne avant d'utiliser ElizaOS. »
« Dans ce cas, cette affirmation est effectivement valable, car l'inspiration d'ElizaOS provient entièrement de BabyAGI. Ici, « inspiration » peut presque être compris comme le fait que BabyAGI a en réalité posé les bases de la technologie RAG (Retrieval-Augmented Generation, génération augmentée par récupération). »
De nombreux cadres existants non seulement sont inférieurs à BabyAGI (Pippin), mais sont même inspirés par BabyAGI. Bien que ai16z ait sa valeur unique dans certains aspects, sa valorisation est manifestement déraisonnable par rapport à Pippin.
L'« avantage du premier arrivé » est en effet un facteur important, mais lorsque des technologies plus puissantes apparaissent, nous devons réévaluer nos préjugés, sinon nous pourrions rater de véritables opportunités.
Ne négligez pas Yohei
Yohei est considéré comme le « parrain de l'IA », il a une vaste expérience dans le domaine de l'IA et a toujours été un pionnier dans ce domaine. Il gère actuellement un fonds de capital-risque et utilise la technologie qu'il a développée pour guider les investissements. Actuellement, sa tâche principale est le cadre Pippin. Il espère créer un modèle commercial capable de fonctionner de manière autonome et de générer des bénéfices en s'appuyant sur le cadre Pippin, et il possède en effet les compétences techniques nécessaires pour y parvenir.
P.S. : Yohei a même attiré l'attention de Jeff Bezos, ce qui prouve son influence.