Auteur : jolestar

La semaine dernière, j'ai exploré un peu l'agent IA, et avant-hier, j'ai participé à un événement ai16z à Pékin, voulant voir ce que l'agent IA peut réellement faire maintenant et réfléchir à ce qu'il pourra faire à l'avenir.

L'état actuel de l'agent IA me rappelle ce meme, où une personne est cachée dans un distributeur automatique. Tout le monde imagine déjà que l'agent IA a commencé à avoir une conscience autonome, mais en réalité, l'agent IA cache un développeur. (Ici, tout le monde peut imaginer la scène, j'ai essayé de faire générer cette image par l'IA, mais j'ai découvert que l'IA ne pouvait pas comprendre 'cacher')

Fonctionnement de base du cadre de l'agent IA

Le cadre de l'agent IA joue actuellement un rôle de liant, reliant le client (Twitter, Discord, Telegram, etc.) et divers plugins (différentes chaînes, etc.), puis le cadre fournit une bibliothèque de base (mémoire, stockage, isolation de session, génération de contexte), qui sera ensuite connectée à diverses interfaces de plateformes IA.

Comment le cadre de l'agent IA s'intègre aux applications et aux scénarios commerciaux

Depuis l'explosion de l'IA l'année dernière, de nombreuses plateformes et outils ont émergé, le plus crucial étant de résoudre un problème : comment l'IA s'intègre-t-elle aux applications ? Certaines plateformes IA tentent de fournir des plugins, d'autres construisent des modèles de flux de travail, et il y a aussi des applications traditionnelles intégrant l'IA en leur sein. Mais la clé ici est : 1. Où se trouve le point d'interaction de l'application ? 2. Comment l'IA s'intègre-t-elle à la logique métier existante.

Tous les portails d'interaction des applications AI offerts aux utilisateurs par diverses plateformes AI ressemblent à une fenêtre de chat, et il est évident que tout le monde pense que l'interaction avec les applications AI devrait être 'humanisée'. À cet égard, l'intelligence de l'agent IA réside dans le fait qu'il se connecte directement à tous les IM ouverts et aux systèmes sociaux, ce qui est manifestement plus acceptable que de créer quelque chose de nouveau.

Comment l'IA s'intègre-t-elle à la logique métier existante ? La solution fournie par l'agent IA est de permettre aux développeurs d'intégrer les décisions de l'IA dans le scénario métier. Les langages de programmation nécessitent de la détermination, les conditions if ne peuvent être que true ou false, et ne peuvent pas traiter des logiques métier floues. Grâce à l'IA, il est possible de convertir des logiques complexes en conditions précises, qui peuvent ensuite être intégrées de manière transparente dans des scénarios métier.

Par exemple, la fonction de réponse aux messages dans un groupe, dans les bots IM traditionnels, nécessite des commandes de message explicites pour être déclenchée, tandis qu'avec l'IA, un méthode shouldReplyMessage peut être implémentée, en lui fournissant le contexte, elle renvoie true ou false.

Le rôle de l'IA dans les scénarios de logique métier est principalement :

1. Découverte des 'intentions' : à l'aide des indications dans les prompts, permettre à l'IA de découvrir les 'intentions' dans les messages textuels des utilisateurs en fonction du contexte, et de mapper ces intentions à un code spécifique.

2. Assistance à la décision : convertir des conditions complexes floues en types déterminés true/false ou énumérés, puis les intégrer dans la logique métier.

À ce stade, beaucoup de gens pourraient être déçus par l'agent IA, car beaucoup pensent que l'agent IA est juste une question d'enseigner à l'IA et qu'elle saura tout faire. En réalité, en raison des limitations de contexte des grands modèles, il est impossible (du moins pour l'instant) de créer un IA universelle capable de tout faire. Mais la bonne nouvelle est que les programmeurs n'ont pas à s'inquiéter de perdre leur emploi, car un grand nombre de programmeurs sont toujours nécessaires derrière l'IA, et il faut encore quelqu'un pour empiler des if else, mais la différence clé est que les frontières des affaires que les programmes peuvent traiter s'élargissent.

Deux types d'agents IA

Lors de l'événement, j'ai posé une question à Shaw. Le marché a deux attentes concernant l'agent IA : 1. L'agent IA joue lui-même un rôle, a sa propre ID, sa propre marque, et fournit des services aux utilisateurs. 2. L'utilisateur a un agent IA personnel, équivalent à un assistant personnel, qui peut aider l'utilisateur à gérer certaines affaires. Lequel de ces deux types d'agents IA sera plus populaire ? Il pense que les deux directions sont bonnes et qu'elles pourraient également se combiner.

Actuellement, sur le marché, les gens explorent principalement cette première direction. Cette direction ressemble à une transformation des services vers l'agent IA, et à l'avenir, il se pourrait qu'il n'y ait plus d'interface d'application, tous les apps seraient transformées en agents IA, humanisés. La deuxième direction concerne l'agentification des clients d'application, où les clients d'application futurs seraient un plugin d'agent assistant, faisant de leurs données locales une partie de la mémoire de l'agent, tandis que ce plugin serait également responsable de la communication avec l'agent de service basé sur le cloud. Cela représente un nouveau modèle d'architecture d'application qui changera l'ensemble de l'infrastructure.

Exigences de l'agent IA envers l'infrastructure

1. L'infrastructure doit être sans barrière d'entrée (Permissionless), sinon l'agent IA sera limité par diverses stratégies de défense contre les attaques, et le service devrait être protégé par des coûts économiques (Gas). À cet égard, les plateformes ayant un faible degré d'ouverture seront confrontées à de grands impacts, et l'enthousiasme pour les plateformes ouvertes au début de Web2 sera ravivé.

2. L'agent IA doit pouvoir gérer des fonds pour effectuer des paiements afin de résoudre le problème ci-dessus.

En d'autres termes, les services futurs, qu'ils soient basés sur la blockchain ou non, devront prendre en charge l'authentification par clé privée Crypto ainsi que les paiements basés sur Crypto.

La combinaison de l'agent IA et de la chaîne

En plus des deux points mentionnés ci-dessus, la manière dont l'agent IA s'intègre à la chaîne est une direction que tout le monde explore. Lors de l'événement, j'ai discuté avec Mikkke de son projet focEliza. Les deux types d'agents IA mentionnés précédemment, au moins le premier, nécessitent un environnement d'exécution ou de validation fourni par la chaîne. En effet, une fois qu'un agent IA propose des services externes, un problème de confiance se pose ; son rôle est en réalité similaire à celui d'un contrat intelligent.

Il y a eu une controverse sur le nom 'contrat intelligent', car c'est juste un morceau de code, où est 'l'intelligence' ? L'IA peut rendre les contrats intelligents vraiment intelligents. Le défi est de savoir comment appeler l'interface de l'IA dans l'environnement des contrats intelligents. Si faire fonctionner un grand modèle dans un environnement vérifiable est encore un chemin lointain, utiliser une solution similaire à Oracle est une voie plus réalisable.

De nombreuses demandes découleront de l'agent IA. Comment obtenir les connaissances publiques de l'agent IA ? Comment l'agent IA peut-il évaluer les faits ? Comment l'agent IA peut-il identifier le même utilisateur sur différentes plateformes ? Comment la 'mémoire' dans un contrat intelligent peut-elle être stockée ? Si j'ai plusieurs appareils, chacun avec un agent IA, comment peuvent-ils partager la mémoire ?

Vous découvrirez que ce qui a été fait dans Web3 concernant la 'chaîne de données', la chaîne de relations, le DID, les réseaux P2P, etc., a de nouvelles significations et scénarios.

Conclusion

Je réutilise ma conclusion d'une présentation sur l'IA et la blockchain en 2021 : Un Internet plus amical pour l'IA est également un Internet plus amical pour l'humanité. À l'époque, c'était juste une idée, mais maintenant l'avenir est là.