Autor: jolestar

La semana pasada jugué un poco con AI Agent, anteayer asistí a un evento de ai16z en Beijing, quería ver qué puede hacer realmente AI Agent ahora y reflexionar sobre lo que podrá hacer en el futuro.

El estado actual de los AI Agents me recuerda a ese meme, donde hay una persona escondida dentro de una máquina expendedora. Todos han imaginado que los AI Agents ya comienzan a tener conciencia propia, pero en realidad, dentro de los AI Agents, hay un desarrollador escondido. (Aquí todos imaginan la escena, intenté hacer que AI generara esta imagen, pero descubrí que AI no puede entender 'esconder').

Método de trabajo básico del marco de AI Agent

El marco de AI Agent actúa actualmente como un adhesivo, uniendo clientes (Twitter, Discord, Telegram, etc.) y varios complementos (varias cadenas, etc.), y luego el marco proporciona una biblioteca básica (almacenamiento de memoria, aislamiento de sesiones, generación de contexto), para más adelante conectar diversas interfaces de plataformas de AI.

Cómo se combina el marco de AI Agent con aplicaciones y escenarios de negocio

Desde que AI se volvió popular el año pasado, han surgido diversas plataformas y herramientas, y la clave es resolver un problema: cómo se combina AI con las aplicaciones. Algunas plataformas de AI intentan ofrecer complementos, otras crean modelos de flujo de trabajo, y algunas aplicaciones tradicionales integran AI dentro de la aplicación. Pero lo clave aquí es: 1. ¿Dónde está la entrada de interacción de la aplicación? 2. ¿Cómo se combina AI con la lógica de negocio existente?

Las entradas de interacción de las aplicaciones que ofrecen las diversas plataformas de AI a los usuarios son un cuadro de diálogo similar a una ventana de chat, y claramente todos creen que la forma de interacción con las aplicaciones de AI debería ser de manera 'humanizada'. Y aquí es donde AI Agent es inteligente, ya que se conecta directamente a todos los IM abiertos y sistemas sociales, lo que es claramente más aceptable que crear uno nuevo.

Cómo se combina AI con la lógica de negocio existente. La solución proporcionada por AI Agent es permitir que los desarrolladores integren las decisiones de AI en los escenarios de negocio. Los lenguajes de programación necesitan ser deterministas, las condiciones de if solo pueden ser true o false, no se pueden manejar lógicas de negocio difusas. A través de AI, se pueden convertir lógicas complejas en condiciones precisas, que luego se pueden integrar sin problemas en los escenarios de negocio.

Por ejemplo, la función de responder mensajes en un grupo, el bot de IM tradicional necesita comandos de mensaje claros para activarse, mientras que a través de AI se puede implementar un método llamado shouldReplyMessage, dándole contexto, devolverá true o false.

El papel de AI en los escenarios de lógica de negocio es principalmente:

1. Descubrimiento de 'intenciones': a través de las instrucciones en las palabras clave, permitir que AI descubra las 'intenciones' en los mensajes de texto del usuario según el contexto, mapeando la intención a un código específico.

2. Asistencia en la toma de decisiones: a través de AI, convertir las condiciones complejas difusas en true/false determinados o tipos enumerados, y luego integrarlas en la lógica de negocio.

Al llegar aquí, muchas personas pueden sentirse decepcionadas con AI Agent; muchos piensan que un AI Agent es simplemente enseñarle a AI y que podrá hacer todo. En realidad, debido a las limitaciones de contexto de los modelos grandes, no se puede (al menos actualmente) crear un AI todopoderoso que pueda hacer cualquier cosa. Pero la buena noticia es que los programadores no tienen que preocuparse por perder su empleo, AI aún necesita ocultar a muchos programadores, y se necesita a alguien para manejar if else, pero la diferencia clave es que los límites de negocio que los programas pueden manejar están en expansión.

Dos tipos de AI Agents

En el evento, le hice una pregunta a Shaw, el mercado tiene dos expectativas para AI Agents: 1. AI Agent desempeña un rol por sí mismo, tiene su propio ID y marca, y proporciona servicios a los usuarios. 2. Los usuarios tienen su propio AI Agent, que actúa como asistente personal, ayudando a los usuarios a manejar algunos negocios. ¿Cuál de estos dos tipos de AI Agents será más popular? Él cree que ambas direcciones serán buenas y también es posible que se combinen.

En el mercado, la mayoría de la gente todavía explora la primera dirección. Esta dirección es similar a la transformación de AI Agent en servicio, en el futuro puede que ya no haya interfaz de App, todas las Apps se convertirán en AI Agents, humanizadas. La segunda dirección es la transformación de los clientes de aplicaciones en Agents, donde los futuros clientes de aplicaciones serán un complemento del Agent asistente, convirtiendo los datos locales de la aplicación en parte de la memoria del Agent, mientras que este complemento también será responsable de comunicarse con el Agent de servicio en la nube. Y este es un nuevo modelo de arquitectura de aplicación que cambiará toda la infraestructura.

Requisitos de infraestructura para AI Agent

1. La infraestructura debe lograr sin barreras de entrada (Permissionless), de lo contrario, AI Agent será restringido por diversas estrategias de defensa contra ataques, el servicio debería utilizar un costo económico (Gas) para prevenir ataques. En este sentido, las plataformas con un bajo nivel de apertura enfrentarán impactos significativos, el auge de plataformas abiertas en los primeros días de Web2 se reavivará.

2. AI Agent necesita poder operar fondos para pagar, con el fin de resolver el problema anterior.

Es decir, en el futuro, los servicios, ya sean basados en blockchain o no, necesitarán soportar la autenticación de identidad basada en el modo de clave privada de Crypto y pagos basados en Crypto.

La combinación de AI Agent y la cadena

Además de los dos puntos mencionados anteriormente, cómo se combina AI Agent con la cadena es una dirección que todos están explorando. En el evento, hablé con Mikkke sobre focEliza que está desarrollando. Las dos tipos de AI Agents mencionadas anteriormente, al menos la primera, requieren un entorno de ejecución o verificación proporcionado por la cadena. Porque una vez que un AI Agent ofrece servicios al público, habrá un problema de confianza, el rol que desempeña es en realidad el mismo que un contrato inteligente.

Sobre el nombre 'contrato inteligente', hubo una controversia hace años, ya que solo es una línea de código, ¿dónde está lo 'inteligente'? AI puede hacer que un contrato inteligente sea realmente inteligente. El desafío es cómo invocar interfaces de AI en el entorno del contrato inteligente. Si bien hacer que un modelo grande funcione en un entorno verificable aún está lejos, utilizar una solución similar a Oracle es un camino más práctico.

Y alrededor de AI Agent surgirán muchas demandas, ¿cómo se obtiene el conocimiento público de AI Agent? ¿Cómo determina AI Agent los hechos? ¿Cómo puede AI Agent identificar al mismo usuario en diferentes plataformas? ¿Cómo se almacenan los 'recuerdos' en los contratos inteligentes? Si tengo varios dispositivos, cada uno con un AI Agent instalado, ¿cómo comparten la memoria?

Te darás cuenta de que lo que se hizo en Web3, como 'datos en la cadena', relaciones en la cadena, DID, redes P2P, etc., tienen nuevos significados y escenarios.

Conclusión

Reutilizando mi conclusión de una presentación sobre AI y blockchain en 2021, un internet más amigable para AI también es un internet más amigable para la humanidad. En ese momento, solo era una idea, pero ahora el futuro ha llegado.