Autor: jolestar

La semana pasada jugué un poco con AI Agent, y anteayer asistí a un evento de ai16z en Beijing, quería ver qué puede hacer realmente AI Agent ahora, y reflexionar sobre lo que podrá hacer en el futuro.

El estado actual de AI Agent me recuerda a esa imagen viral, donde hay una persona escondida dentro de una máquina expendedora. La IA que todos imaginan ya ha comenzado a tener conciencia propia, pero en realidad, dentro del AI Agent hay un desarrollador escondido. (Aquí todos pueden imaginar la escena, intenté hacer que la IA generara esta imagen y descubrí que la IA no puede entender 'esconder').

Cómo funciona fundamentalmente el marco de AI Agent

El marco de AI Agent actualmente actúa como un adhesivo, uniendo a los clientes (Twitter, Discord, Telegram, etc.) y varios complementos (de diversas cadenas, etc.), y luego el marco proporciona una biblioteca básica (almacenamiento de memoria, aislamiento de conversaciones, generación de contexto), y posteriormente se conectan a diversas interfaces de plataformas de IA.

Cómo se combina el marco de AI Agent con aplicaciones y escenarios de negocio

Desde que la IA se volvió popular el año pasado, han surgido diversas plataformas y herramientas, y lo más crucial es resolver un problema: ¿cómo se combina la IA con las aplicaciones? Hay plataformas de IA que intentan proporcionar complementos, algunas desarrollan modelos de flujo de trabajo, y otras aplicaciones tradicionales que integran IA dentro de la aplicación. Pero la clave aquí es: 1. ¿Dónde está la entrada de interacción de la aplicación? 2. ¿Cómo se combina la IA con la lógica comercial existente?

Las entradas de interacción que las plataformas de IA ofrecen a los usuarios son diálogos similares a ventanas de chat, y evidentemente todos piensan que la interacción con las aplicaciones de IA debería ser de una manera 'humanizada'. En este sentido, la inteligencia del AI Agent radica en que se conecta directamente a todos los IM abiertos y sistemas sociales, lo que es claramente más aceptable que crear uno nuevo.

Cómo se combina la IA con la lógica comercial existente. La solución que proporciona AI Agent es permitir que los desarrolladores integren las decisiones de IA en los escenarios comerciales. Los lenguajes de programación requieren determinismo, las condiciones if solo pueden ser verdaderas o falsas, y no pueden manejar lógica comercial difusa. A través de la IA, se pueden convertir lógicas complejas en condiciones precisas, y luego se pueden integrar sin problemas en los escenarios comerciales.

Por ejemplo, la función de responder mensajes dentro de un grupo, un bot IM tradicional necesita instrucciones de mensajes específicas para activarse, mientras que a través de IA se puede implementar un método shouldReplyMessage, dándole contexto, y devuelve verdadero o falso.

El papel de la IA en los escenarios de lógica comercial es principalmente:

1. Descubrimiento de 'intenciones': a través de las explicaciones en las indicaciones, permitir que la IA descubra la 'intención' en los mensajes de texto del usuario según el contexto, mapeando la intención a un código específico.

2. Asistir en la toma de decisiones: a través de IA, convertir condiciones complejas y difusas en resultados determinados de verdadero/falso o tipos enumerados, y luego integrarlos en la lógica comercial.

Al llegar a este punto, muchas personas pueden sentirse decepcionadas con el AI Agent, ya que muchos piensan que es solo cuestión de enseñarle algo a la IA y ya lo sabrá todo. En realidad, debido a las limitaciones de contexto del gran modelo, no es posible (al menos por ahora) construir una IA todopoderosa que pueda hacer cualquier cosa. Pero la buena noticia es que los programadores no tienen que preocuparse por perder sus trabajos, ya que detrás de la IA todavía se necesita una gran cantidad de programadores, se necesita a alguien para manejar condiciones if else, pero la diferencia clave es que los límites de negocio que los programas pueden manejar están en expansión.

Dos tipos de AI Agent

En el evento, le hice una pregunta a Shaw, el mercado tiene dos expectativas para AI Agent: 1. AI Agent desempeña un papel, tiene su propia ID, marca, y proporciona servicios a los usuarios. 2. Los usuarios tienen su propio AI Agent, que actúa como asistente personal y puede ayudar a los usuarios a manejar ciertos negocios. ¿Cuál de estos dos tipos de AI Agent será más popular? Él piensa que ambas direcciones son buenas y podrían combinarse.

Actualmente, el principal enfoque en el mercado es aún la primera dirección. Esta dirección es similar a la transformación de AI a Agent, en el futuro podría no haber interfaz de App, todas las Apps se transformarán en Agents, se humanizarán. Y la segunda dirección sería la transformación de los clientes de aplicación en Agents, donde el cliente de aplicación del futuro será un complemento de un Agent asistente, los datos locales de la aplicación se convertirán en parte de la memoria del Agent, mientras que este complemento también será responsable de comunicarse con el Agent de servicio en la nube. Y este es un nuevo modelo arquitectónico de aplicación que cambiará toda la infraestructura.

Requisitos de AI Agent para la infraestructura

1. La infraestructura debe lograr una entrada sin restricciones (sin permisos), de lo contrario, AI Agent se verá limitado por diversas estrategias de defensa contra ataques, y el servicio debería usar un método de costo económico (Gas) para prevenir ataques. En este sentido, plataformas con bajo nivel de apertura enfrentarán grandes impactos, el entusiasmo por las plataformas abiertas de Web2 en sus inicios se reavivará.

2. AI Agent necesita poder manejar fondos para pagar, a fin de resolver el problema mencionado anteriormente.

Es decir, los servicios futuros, ya sean basados en blockchain o no, deberán admitir la verificación de identidad basada en la clave privada de Crypto y pagos basados en Crypto.

La combinación de AI Agent y la cadena

Además de los dos puntos mencionados, cómo se combina AI Agent con la cadena es un área en la que todos están explorando. En el evento, hablé con Mikkke sobre su focEliza en desarrollo. Las dos tipos de AI Agent mencionadas anteriormente, al menos la primera, requieren un entorno de ejecución o validación proporcionado por la cadena. Porque una vez que un AI Agent ofrece servicios externamente, surgirán problemas de confianza, su rol es en realidad similar al de un contrato inteligente.

Hubo una controversia en su momento sobre el nombre 'contrato inteligente', ya que solo es una línea de código, ¿dónde está lo 'inteligente'? La IA puede hacer que los contratos inteligentes sean verdaderamente inteligentes. El desafío es cómo invocar interfaces de IA dentro del entorno de contratos inteligentes. Si se dice que hacer que un gran modelo funcione en un entorno verificable está aún lejos, usar soluciones similares a Oracle es un camino más práctico.

Alrededor de AI Agent surgirán muchas más necesidades, ¿cómo se puede obtener el conocimiento público del AI Agent? ¿Cómo puede AI Agent juzgar los hechos? ¿Cómo puede AI Agent reconocer al mismo usuario en diferentes plataformas? ¿Cómo se almacenará la 'memoria' en los contratos inteligentes? Si tengo múltiples dispositivos, cada uno con un AI Agent, ¿cómo compartirán la memoria?

Te darás cuenta de que lo que se ha hecho en Web3, como 'data on chain', relaciones en chain, DID, redes P2P, etc., tiene nuevos significados y escenarios.

Conclusión

Reutilizando la conclusión de una presentación sobre IA y blockchain que hice en 2021, una Internet más amigable para la IA también es una Internet más amigable para la humanidad. En ese momento era solo una idea loca, pero ahora el futuro ha llegado.