Source de l'article : PA recommande
Auteur : jolestar
La semaine dernière, j'ai joué un peu avec l'Agent IA, avant-hier, j'ai assisté à un événement organisé par ai16z à Pékin, je voulais voir ce que l'Agent IA peut réellement faire maintenant et réfléchir à ce qu'il pourrait faire à l'avenir.
L'état actuel des Agents IA me rappelle ce mème, où une personne est cachée à l'intérieur d'un distributeur automatique. Les gens imaginent déjà que l'Agent IA a commencé à avoir une conscience autonome, mais en réalité, il y a un développeur caché à l'intérieur de l'Agent IA. (Ici, tout le monde imagine la scène, j'ai essayé de faire générer cette image par l'IA, mais l'IA ne comprend pas le mot 'caché')
Mode de fonctionnement de base du cadre de l'Agent IA
Le cadre de l'Agent IA joue actuellement le rôle d'un adhésif, liant le client (Twitter, Discord, Telegram, etc.) et divers plugins (comme les chaînes, etc.), puis le cadre fournit une bibliothèque de base (stockage de mémoire, isolation de session, génération de contexte), etc., avant de se connecter à diverses interfaces de plateformes IA.
Comment le cadre de l'Agent IA se combine avec les applications et les scénarios d'affaires
Depuis l'engouement pour l'IA l'année dernière, diverses plateformes et outils ont émergé, le plus crucial étant de résoudre un problème : comment l'IA s'intègre-t-elle aux applications. Certaines plateformes IA tentent de fournir des plugins, d'autres construisent des modèles de flux de travail, et certaines applications traditionnelles intègrent l'IA dans l'application elle-même. Mais la clé ici est : 1. Où se trouve le point d'interaction de l'application ? 2. Comment l'IA s'intègre-t-elle à la logique commerciale existante.
Les points d'interaction des applications fournies par les différentes plateformes IA sont tous des fenêtres de dialogue similaires à une conversation, il est évident que tout le monde pense que l'interaction avec les applications IA devrait se faire de manière 'humanisée'. L'intelligence de l'Agent IA réside dans le fait qu'il se connecte directement à tous les systèmes de messagerie instantanée ouverts ainsi qu'aux systèmes sociaux, ce qui est clairement plus acceptable que de créer quelque chose de nouveau.
Comment l'IA s'intègre-t-elle à la logique commerciale existante. La solution fournie par l'Agent IA est de permettre aux développeurs d'intégrer les décisions de l'IA dans des scénarios d'affaires. Les langages de programmation nécessitent de la détermination, les conditions 'if' ne peuvent être que true ou false, incapables de traiter des logiques commerciales ambiguës. Cependant, grâce à l'IA, on peut transformer des logiques complexes en conditions précises, puis les intégrer sans problème dans des scénarios d'affaires.
Par exemple, la fonction de réponse aux messages dans un groupe, les bots IM traditionnels doivent être déclenchés par des commandes de message explicites, tandis qu'avec l'IA, on peut réaliser une méthode shouldReplyMessage, lui donner un contexte, et elle renvoie true ou false.
Le rôle de l'IA dans les scénarios de logique commerciale est principalement :
1. Découverte des 'intentions' : grâce aux indications dans les mots-clés, l'IA découvre l' 'intention' dans le message texte de l'utilisateur selon le contexte et mappe l'intention à un code spécifique.
2. Assistance à la décision : en utilisant l'IA pour transformer des conditions complexes floues en true/false déterminés ou en types énumérés, puis en les intégrant dans la logique d'affaires.
En voyant cela, beaucoup de gens pourraient être déçus par l'Agent IA, beaucoup pensent que l'Agent IA est juste un moyen d'apprendre à l'IA, et elle saura tout faire. En réalité, à cause des limitations de contexte des grands modèles, il est impossible (au moins actuellement) de créer une IA universelle qui puisse tout faire. Mais la bonne nouvelle est que les programmeurs n'ont pas à s'inquiéter de perdre leur emploi, l'IA aura toujours besoin de beaucoup de programmeurs cachés derrière, et il faudra quelqu'un pour empiler des 'if else', mais la différence clé est que les limites des affaires que les programmes peuvent traiter s'élargissent.
Deux types d'Agents IA
Lors de l'événement, j'ai posé une question à Shaw, le marché a deux attentes pour l'Agent IA : 1. L'Agent IA joue un rôle, a sa propre ID, sa marque, et fournit des services aux utilisateurs. 2. Les utilisateurs ont leur propre Agent IA, semblable à un assistant personnel, pouvant aider les utilisateurs à gérer certaines affaires. Lequel de ces deux types d'Agents IA sera le plus populaire ? Il pense que les deux directions sont bonnes et qu'elles pourraient aussi se combiner.
Actuellement, sur le marché, tout le monde explore principalement la première direction. Cette direction est semblable à la transformation des services en Agents IA, à l'avenir, il se peut qu'il n'y ait plus d'interface d'application, toutes les applications seront devenues des Agents IA, humanisées. La seconde direction concerne l'agentification des clients d'application, les clients d'application futurs seront un plugin d'Agent assistant, les données locales de l'application deviendront une partie de la mémoire de l'Agent, et ce plugin sera également responsable de la communication avec les Agents de service dans le cloud. C'est un nouveau modèle d'architecture d'application qui changera toute l'infrastructure.
Les exigences de l'Agent IA pour l'infrastructure
1. L'infrastructure doit réaliser un seuil d'entrée sans permission (Permissionless), sinon l'Agent IA sera limité par diverses stratégies de protection contre les attaques, les services devraient utiliser des coûts économiques (Gas) pour se protéger. À cet égard, les plateformes ayant un faible degré d'ouverture feront face à de grands chocs, le boom des plateformes ouvertes au début de Web2 sera ravivé.
2. L'Agent IA doit pouvoir manipuler des fonds pour payer, afin de résoudre les problèmes mentionnés ci-dessus.
Autrement dit, les services futurs, qu'ils soient basés sur la blockchain ou non, devront prendre en charge l'authentification par clé privée Crypto ainsi que les paiements basés sur Crypto.
La combinaison de l'Agent IA et de la chaîne
Au-delà des deux points mentionnés ci-dessus, comment l'Agent IA se combine-t-il à la chaîne est un domaine que tout le monde explore actuellement. Lors de l'événement, j'ai discuté avec Mikkke de son projet focEliza. Les deux types d'Agents IA mentionnés précédemment, au moins le premier nécessite un environnement d'exécution ou de vérification fourni par la chaîne. Car une fois qu'un Agent IA fournit des services externes, il y aura un problème de confiance, le rôle qu'il joue est en fait similaire à celui d'un contrat intelligent.
Le nom 'contrat intelligent' a suscité une controverse à l'époque, ce n'est qu'un morceau de code, où est le 'intelligent' ? L'IA peut rendre les contrats intelligents vraiment intelligents. Le défi est de savoir comment appeler les interfaces IA dans l'environnement des contrats intelligents. Si faire tourner un grand modèle dans un environnement vérifiable est encore un long chemin, utiliser une solution similaire à Oracle est un chemin beaucoup plus réalisable.
Et autour des Agents IA, il surgira de nombreux besoins, comment obtenir les connaissances publiques de l'Agent IA ? Comment l'Agent IA détermine-t-il les faits ? Comment l'Agent IA identifie-t-il le même utilisateur sur différentes plateformes ? Comment la 'mémoire' dans les contrats intelligents est-elle stockée ? Si j'ai plusieurs appareils, chacun ayant un Agent IA, comment partagent-ils la mémoire ?
Vous constaterez alors que ce qui a été fait dans le Web3 concernant la 'mise en chaîne des données', les relations en chaîne, le DID, les réseaux P2P, etc., acquiert de nouvelles significations et de nouveaux scénarios.
Conclusion
Réutilisant ma conclusion d'une présentation sur l'IA et la blockchain en 2021, un Internet plus amical envers l'IA est aussi un Internet plus amical envers l'humanité. À l'époque, ce n'était qu'une idée, mais maintenant l'avenir est là.