Auteur : jolestar

La semaine dernière, j'ai exploré un peu l'agent AI. Avant-hier, j'ai assisté à un événement ai16z à Pékin, pour voir ce que l'agent AI peut réellement faire et réfléchir à ce qu'il pourra faire à l'avenir.

L'état actuel des agents AI me rappelle ce mème, où une personne est cachée à l'intérieur d'un distributeur automatique. L'agent AI que les gens imaginent a déjà commencé à avoir une conscience autonome, mais en réalité, l'agent AI cache en fait un développeur. (Ici, les gens peuvent imaginer la scène, j'ai essayé de faire générer cette image par l'AI, mais j'ai découvert que l'AI ne pouvait pas comprendre le mot 'caché')

La méthode de travail de base du cadre de l'agent AI

Le cadre de l'agent AI joue actuellement le rôle d'un agent liant, reliant le client (Twitter, Discord, Telegram, etc.) et divers plugins (chaînes, etc.), puis le cadre fournit une bibliothèque de base (stockage de mémoire, isolation de session, génération de contexte, etc.) pour connecter diverses interfaces de plateformes AI par la suite.

Comment le cadre de l'agent AI s'intègre-t-il aux applications et aux scénarios commerciaux

Depuis l'explosion de l'AI l'année dernière, de nombreuses plateformes et outils ont émergé. Le problème clé à résoudre est : comment l'AI peut-elle s'intégrer aux applications ? Certaines plateformes AI tentent de fournir des plugins, d'autres construisent des modèles de flux de travail, et certaines applications traditionnelles intègrent l'AI. Mais les questions clés sont : 1. Où se trouvent les points d'entrée d'interaction des applications ? 2. Comment l'AI peut-elle s'intégrer à la logique commerciale existante ?

Tous les points d'entrée d'interaction des applications fournies par les plateformes AI aux utilisateurs sont des fenêtres de dialogue similaires à des fenêtres de chat. Il est clair que tout le monde pense que l'interaction avec les applications AI devrait se faire de manière 'humanisée'. À cet égard, l'intelligence de l'agent AI réside dans le fait qu'il se connecte directement à tous les IM ouverts et aux systèmes sociaux, ce qui est manifestement plus facile à accepter que de créer quelque chose de nouveau.

Comment l'AI peut-elle s'intégrer à la logique commerciale existante ? La solution fournie par l'agent AI est de permettre aux développeurs d'intégrer les décisions de l'AI dans les scénarios commerciaux. Le langage de programmation nécessite de la détermination, la condition 'if' ne peut être que true ou false, et ne peut pas traiter une logique commerciale floue. Cependant, grâce à l'AI, il est possible de convertir une logique complexe en conditions précises, qui peuvent ensuite être intégrées de manière transparente dans le scénario commercial.

Par exemple, la fonction de réponse aux messages dans le groupe, le bot IM traditionnel doit être déclenché par des instructions de message explicites, alors qu'avec l'AI, on peut réaliser une méthode shouldReplyMessage, lui donner un contexte, et il renvoie true ou false.

Le rôle de l'AI dans les scénarios de logique commerciale est principalement :

1. Découverte de l' 'intention' : à travers les indications dans les mots-clés, permettre à l'AI de découvrir l' 'intention' des messages textuels des utilisateurs en fonction du contexte, et de mapper cette intention à un code spécifique.

2. Assistance à la décision : transformer des conditions complexes floues en true/false déterminés ou en types énumérés, puis les intégrer dans la logique commerciale.

En arrivant ici, beaucoup de gens pourraient être déçus par l'agent AI, car beaucoup pensent que l'agent AI est simplement une question d'apprendre à l'AI et qu'il saura tout faire. En réalité, en raison des limites de contexte des grands modèles, il n'est pas possible (du moins actuellement) de créer un AI universel capable de faire n'importe quoi. Mais la bonne nouvelle est que les programmeurs n'ont pas à s'inquiéter de perdre leur emploi, car l'AI nécessitera toujours un grand nombre de programmeurs, et il faudra encore des gens pour gérer des instructions if else, mais la différence clé est que les frontières des affaires que les programmes peuvent traiter s'élargissent.

Deux types d'agents AI

Lors de l'événement, j'ai posé une question à Shaw : le marché a deux attentes vis-à-vis des agents AI : 1. L'agent AI joue un rôle avec son propre ID, sa propre marque, et fournit des services aux utilisateurs. 2. L'utilisateur a un agent AI personnel, équivalent à un assistant personnel, pouvant aider l'utilisateur à gérer certaines affaires. Lequel des deux types d'agents AI sera plus populaire ? Il pense que les deux directions sont bonnes et pourraient même se combiner.

Actuellement, le principal axe exploré sur le marché est toujours le premier. Cet axe est similaire à la transformation des agents en services AI, et à l'avenir, il pourrait ne plus y avoir d'interface d'application, car toutes les applications seraient des agents AI, humanisées. Le deuxième axe concerne l'humanisation des agents des clients d'application, où les futurs clients d'application seront un plugin d'agent assistant, transformant les données locales de l'application en une partie de la mémoire de l'agent, tandis que ce plugin sera également responsable de la communication avec l'agent de service dans le cloud. C'est un nouveau modèle d'architecture d'application qui changera l'ensemble de l'infrastructure.

Les exigences de l'agent AI pour l'infrastructure

1. L'infrastructure doit réaliser une absence de barrière d'entrée (Permissionless), sinon l'agent AI sera limité par diverses stratégies anti-attaque, et le service devrait utiliser un coût économique (Gas) pour prévenir les attaques. À cet égard, les plateformes avec un faible niveau d'ouverture feront face à de grands bouleversements, et l'engouement pour les plateformes ouvertes du début de Web2 sera ravivé.

2. L'agent AI doit être capable de gérer des fonds pour payer, afin de résoudre les problèmes ci-dessus.

Cela signifie que, à l'avenir, les services, qu'ils soient basés sur la blockchain ou non, devront prendre en charge l'authentification par clé privée Crypto et les paiements basés sur Crypto.

La combinaison de l'agent AI et de la chaîne

En plus des deux points mentionnés ci-dessus, la manière dont l'agent AI peut s'intégrer à la chaîne est une direction que tout le monde explore. Lors de l'événement, j'ai discuté avec Mikkke de son projet focEliza. Les deux types d'agents AI mentionnés précédemment nécessitent au moins un environnement d'exécution ou de vérification fourni par la chaîne. Car dès qu'un agent AI offre des services externes, il y aura un problème de confiance, son rôle est en réalité similaire à celui d'un contrat intelligent.

Concernant le nom 'contrat intelligent', il y avait une controverse à l'époque. Ce n'est qu'un morceau de code, où est l' 'intelligence' ? L'AI peut donner un sens réel aux contrats intelligents. Le défi est de savoir comment appeler l'interface AI dans un environnement de contrat intelligent. Si faire fonctionner un grand modèle dans un environnement vérifiable est encore loin, utiliser une solution semblable à Oracle est un chemin plus réalisable.

De nombreux besoins vont émerger autour de l'agent AI. Comment obtenir les connaissances publiques de l'agent AI ? Comment l'agent AI détermine-t-il les faits ? Comment l'agent AI reconnaît-il le même utilisateur sur différentes plateformes ? Comment la 'mémoire' dans les contrats intelligents est-elle stockée ? Si j'ai plusieurs appareils, chacun avec un agent AI, comment partagent-ils la mémoire ?

Vous réaliserez que les concepts de 'mise en chaîne des données', de relations en chaîne, de DID, de réseaux P2P, etc., explorés dans le Web3, ont tous de nouvelles significations et de nouveaux scénarios.

Conclusion

Je réutilise la conclusion que j'ai partagée en 2021 sur l'AI et la blockchain : un internet plus amical envers l'AI est également un internet plus amical envers l'humanité. À l'époque, c'était encore juste une idée, mais maintenant l'avenir est arrivé.