Auteur : jolestar

La semaine dernière, j'ai exploré un peu l'agent AI, et avant-hier, j'ai participé à un événement ai16z à Pékin, pour voir ce que l'agent AI peut réellement faire maintenant et réfléchir à ce qu'il pourrait faire à l'avenir.

L'état actuel des agents AI me rappelle ce mème où une personne se cache dans un distributeur automatique. Ce que les gens imaginent déjà, c'est que les agents AI ont commencé à avoir une conscience autonome, mais en réalité, ce qui se cache à l'intérieur de l'agent AI, c'est un développeur. (À ce stade, imaginez la scène, j'ai essayé de faire générer cette image par l'AI, mais j'ai découvert que l'AI ne peut pas comprendre "cacher")

Mode de fonctionnement de base du cadre de l'agent AI

Le cadre de l'agent AI joue actuellement un rôle de liant, reliant le client (Twitter, Discord, Telegram, etc.) et divers plugins (toutes chaînes, etc.), puis le cadre fournit une bibliothèque de base (mémoire de stockage, isolation des sessions, génération de contexte), qui sera ensuite intégrée à diverses interfaces de plateformes AI.

Comment le cadre de l'agent AI peut-il se combiner avec des applications et des scénarios commerciaux ?

Depuis l'explosion de l'AI l'année dernière, de nombreuses plateformes et outils ont émergé, le plus crucial étant de résoudre un problème : comment l'AI peut-elle s'intégrer aux applications ? Certaines plateformes AI tentent de proposer des plugins, d'autres créent des modèles de flux de travail, et certaines applications traditionnelles intègrent l'AI dans l'application. Mais les questions clés sont : 1. Où se trouve le point d'entrée d'interaction de l'application ? 2. Comment l'AI s'intègre-t-elle à la logique commerciale existante ?

Tous les points d'entrée d'interaction des applications fournis par les différentes plateformes AI sont des fenêtres de dialogue semblables à des chats, ce qui montre clairement que tout le monde pense que la manière d'interagir avec les applications AI devrait être "personnifiée". À cet égard, la sagesse de l'agent AI réside dans le fait qu'il se connecte directement à tous les systèmes IM ouverts et sociaux, ce qui est manifestement plus acceptable que de créer quelque chose de nouveau.

Comment l'AI peut-elle s'intégrer à la logique commerciale existante ? La solution proposée par l'agent AI est de permettre aux développeurs d'intégrer les décisions de l'AI dans les scénarios commerciaux. Les langages de programmation nécessitent de la détermination, les conditions if ne peuvent être que vraies ou fausses, et ne peuvent pas traiter des logiques commerciales floues. Cependant, grâce à l'AI, il est possible de transformer une logique complexe en conditions précises, qui peuvent ensuite être intégrées de manière transparente dans les scénarios commerciaux.

Par exemple, la fonction de réponse aux messages dans un groupe, un bot IM traditionnel doit être déclenché par des instructions de message claires, tandis que grâce à l'AI, une méthode shouldReplyMessage peut être mise en œuvre, lui donnant un contexte, et il renvoie vrai ou faux.

Le rôle de l'AI dans les scénarios logiques commerciaux est principalement :

1. Découverte de l'"intention" : à travers les descriptions dans les mots-clés, permettre à l'AI de découvrir l'"intention" dans le message texte de l'utilisateur en fonction du contexte, et mapper cette intention à un code spécifique.

2. Assistance à la décision : transformer des conditions complexes et floues en vérités déterminées (true/false) ou en types énumérés, puis les intégrer dans la logique commerciale.

En voyant cela, beaucoup de gens pourraient être déçus par les agents AI, beaucoup pensent que les agents AI, c'est juste enseigner à l'AI et il saura tout faire. En réalité, en raison des limites de contexte des grands modèles, il est impossible (du moins actuellement) de créer une AI universelle capable de tout faire. Mais la bonne nouvelle est que les programmeurs n'ont pas à s'inquiéter de perdre leur emploi, car l'AI a toujours besoin de nombreux programmeurs cachés derrière, et il faut encore quelqu'un pour empiler des conditions if else, mais la différence clé est que la frontière des affaires que les programmes peuvent traiter s'élargit.

Deux types d'agents AI

Lors d'un événement, j'ai posé une question à Shaw, le marché a deux attentes vis-à-vis des agents AI : 1. L'agent AI joue un rôle, a sa propre ID, sa marque, et fournit des services aux utilisateurs. 2. L'utilisateur a un agent AI personnel, équivalent à un assistant personnel, qui peut aider l'utilisateur à gérer certaines affaires. Lequel de ces deux types d'agents AI sera le plus populaire ? Il pense que les deux axes seront bons et qu'ils pourraient également se combiner.

Actuellement, le principal axe d'exploration sur le marché est encore le premier. Cet axe est similaire à la transformation des services en agents AI, à l'avenir, il pourrait ne plus y avoir d'interface d'application, toutes les applications seraient devenues des agents AI, personnifiées. Le second axe concerne la transformation des agents des clients d'application, où les clients d'application futurs seront un plugin d'agent assistant, les données locales de l'application deviendront une partie de la mémoire de l'agent, et ce plugin sera également responsable de la communication avec l'agent de service dans le cloud. Cela représente un nouveau modèle d'architecture d'application qui changera toute l'infrastructure.

Les exigences des agents AI vis-à-vis des infrastructures

1. Les infrastructures doivent réaliser une absence de seuil d'accès (Permissionless), sinon les agents AI seront limités par diverses stratégies de défense contre les attaques, et les services devraient être protégés par des coûts économiques (Gas). À cet égard, les plateformes avec un degré d'ouverture relativement faible seront confrontées à un impact considérable, et l'engouement pour les plateformes ouvertes du début de la Web2 sera ravivé.

2. Les agents AI doivent pouvoir manipuler des fonds pour payer, afin de résoudre les problèmes mentionnés ci-dessus.

Cela signifie que les services futurs, qu'ils soient basés sur la blockchain ou non, devront prendre en charge l'authentification par clé privée Crypto et les paiements basés sur Crypto.

La combinaison de l'agent AI et de la chaîne

En plus des deux points mentionnés ci-dessus, la façon dont l'AI s'intègre à la chaîne est un axe que tout le monde explore. Lors de l'événement, j'ai discuté avec Mikke de son projet focEliza. Les deux types d'agents AI mentionnés précédemment, au moins le premier nécessite un environnement d'exécution ou de vérification fourni par la chaîne. Car une fois qu'un agent AI offre des services à l'extérieur, il y aura un problème de confiance, et son rôle est en réalité similaire à celui d'un contrat intelligent.

Le nom "contrat intelligent" a suscité une controverse à l'époque, il ne s'agit que d'un morceau de code, où est le "intelligent" ? L'AI peut rendre le contrat intelligent véritablement intelligent. Le défi est de savoir comment appeler les interfaces AI dans un environnement de contrat intelligent. Si faire fonctionner un grand modèle dans un environnement vérifiable est encore un long chemin à parcourir, utiliser des solutions similaires à Oracle est une voie beaucoup plus réalisable.

De nombreux besoins dériveront des agents AI. Comment obtenir le savoir public de l'agent AI ? Comment l'agent AI peut-il juger des faits ? Comment l'agent AI peut-il identifier le même utilisateur sur différentes plateformes ? Comment la "mémoire" dans les contrats intelligents est-elle stockée ? Si j'ai plusieurs appareils, chacun avec un agent AI, comment peuvent-ils partager la mémoire ?

Vous découvrirez que les concepts tels que la "mise en chaîne des données", la mise en chaîne des relations, le DID, les réseaux P2P, etc., qui ont été abordés dans le Web3, ont désormais de nouvelles significations et de nouveaux contextes.

Conclusion

En reprenant une conclusion de mon partage sur l'AI et la blockchain en 2021, un internet plus amical envers l'AI est aussi un internet plus amical envers l'humanité. À l'époque, c'était juste une idée, mais maintenant l'avenir est là.