Autor: jolestar

La semana pasada jugué un poco con el Agente de IA, anteayer asistí a un evento de ai16z en Pekín, quería ver qué puede hacer realmente el Agente de IA ahora, y reflexionar sobre lo que podrá hacer en el futuro.

El estado actual de los Agentes de IA me recuerda ese meme, donde hay una persona escondida en una máquina expendedora. La IA que todos imaginamos ya ha comenzado a tener conciencia propia, pero en realidad, dentro del Agente de IA hay un desarrollador. (Aquí todos imaginen la escena, intenté hacer que la IA generara esta imagen, y descubrí que la IA no puede entender 'esconder').

La forma básica de funcionamiento del marco del Agente de IA

El marco del Agente de IA actualmente actúa como un adhesivo, uniendo al cliente (Twitter, Discord, Telegram, etc.) con varios complementos (cada cadena, etc.), y el marco proporciona una biblioteca básica (almacenamiento de memoria, aislamiento de sesiones, generación de contexto), que luego conectará con diversas interfaces de plataformas de IA.

Cómo el marco del Agente de IA se combina con aplicaciones y escenarios de negocio

Desde que la IA se volvió popular el año pasado, han surgido varias plataformas y herramientas, el punto clave es resolver un problema: cómo se combina la IA con las aplicaciones. Algunas plataformas de IA intentan ofrecer complementos, otras crean modelos de flujo de trabajo, y también hay aplicaciones tradicionales que integran IA dentro de la aplicación. Pero aquí la clave es: 1. ¿Dónde está la entrada de interacción de la aplicación? 2. ¿Cómo se integra la IA con la lógica de negocio existente?

Las entradas de interacción que las diversas plataformas de IA ofrecen a los usuarios son todas similares a un cuadro de diálogo en forma de ventana de chat; evidentemente, todos creen que la forma de interacción con las aplicaciones de IA debería ser de una manera 'humanizada'. Y en este sentido, la inteligencia del Agente de IA radica en que se conecta directamente a todos los sistemas IM abiertos y de redes sociales, lo que es evidentemente más aceptable que crear uno nuevo.

Cómo se integra la IA con la lógica de negocio existente. La solución que ofrece el Agente de IA es permitir que los desarrolladores incorporen las decisiones de IA en los escenarios de negocio. Los lenguajes de programación requieren determinación; las condiciones if solo pueden ser true o false, no pueden manejar lógica de negocio difusa. A través de la IA, se pueden convertir lógicas complejas en condiciones precisas, y luego se pueden integrar sin problemas en los escenarios de negocio.

Por ejemplo, la función de responder mensajes en un grupo, un Bot de IM tradicional necesita instrucciones de mensaje explícitas para activarse, mientras que a través de la IA se puede implementar un método shouldReplyMessage, dándole contexto, y devuelve true o false.

El papel de la IA en los escenarios de lógica de negocio es principalmente:

1. Descubrimiento de 'intenciones': a través de las descripciones en las palabras clave, permitir que la IA descubra la 'intención' en el mensaje de texto del usuario según el contexto, y mapear la intención a un código específico.

2. Asistencia en la toma de decisiones: transformar condiciones complejas y difusas en resultados ciertos (true/false) o tipos enumerados a través de la IA, y luego integrarlos en la lógica de negocio.

Al llegar aquí, muchas personas pueden decepcionarse con el Agente de IA; muchos piensan que el Agente de IA solo necesita ser enseñado un poco a la IA y ya hará cualquier cosa. En realidad, debido a las limitaciones de contexto de los modelos grandes, no es posible (al menos actualmente) crear una IA universal que pueda hacer cualquier cosa. Pero la buena noticia es que los programadores no tienen que preocuparse por perder sus empleos, la IA aún necesita un gran número de programadores detrás, también se necesita alguien para manejar if else, pero la diferencia clave es que los límites de negocio que los programas pueden manejar están en expansión.

Dos tipos de Agentes de IA

En el evento, le hice una pregunta a Shaw: el mercado tiene dos expectativas sobre los Agentes de IA, 1. El Agente de IA desempeña un rol, tiene su propia ID, marca, y proporciona servicios al usuario. 2. El usuario tiene un Agente de IA personal, que actúa como un asistente personal, capaz de ayudar al usuario con algunos negocios. ¿Cuál de estos dos tipos de Agentes de IA será más popular? Él cree que ambas direcciones serán buenas, y también podrían combinarse.

En el mercado actual, todos están explorando principalmente la primera dirección. Esta dirección es similar a la transformación de servicios en Agentes de IA, en el futuro podría no haber interfaz de aplicación, todas las aplicaciones estarán convertidas en Agentes de IA, humanizadas. La segunda dirección es la transformación de los clientes de aplicaciones en Agentes, donde el cliente de aplicación futuro será un complemento del Agente asistente, y los datos locales de la aplicación se convertirán en parte de la memoria del Agente, mientras que este complemento también será responsable de comunicarse con el Agente de servicio en la nube. Esta es una nueva arquitectura de aplicación que cambiará toda la infraestructura.

Requisitos de infraestructura para los Agentes de IA

1. La infraestructura debe lograr un acceso sin barreras (Permissionless), de lo contrario, el Agente de IA se verá restringido por diversas estrategias de defensa contra ataques, y el servicio debe utilizar un costo económico (Gas) para prevenir ataques. En este sentido, las plataformas con un nivel de apertura relativamente bajo enfrentarán un gran impacto, y el fervor por las plataformas abiertas de la era inicial de Web2 volverá a encenderse.

2. El Agente de IA necesita poder operar fondos para pagar, para resolver el problema mencionado anteriormente.

Es decir, los servicios futuros, ya sean o no basados en blockchain, necesitarán soportar la autenticación de identidad mediante claves privadas de Crypto y pagos basados en Crypto.

La combinación del Agente de IA y la cadena

Además de los dos puntos mencionados anteriormente, cómo el Agente de IA se combina con la cadena es una dirección que todos están explorando. En el evento, hablé con Mikkke sobre lo que está haciendo con focEliza. Las dos clases de Agentes de IA mencionadas anteriormente, al menos la primera, necesitan un entorno de ejecución o verificación proporcionado por la cadena. Porque una vez que un Agente de IA ofrece servicios al exterior, habrá un problema de confianza, y el rol que desempeña es en realidad el mismo que el de un contrato inteligente.

Sobre el nombre 'contrato inteligente', hubo una controversia: solo es un fragmento de código, ¿dónde está lo 'inteligente'? La IA puede hacer que los contratos inteligentes sean realmente inteligentes. El desafío es cómo invocar interfaces de IA en un entorno de contrato inteligente. Si se dice que hacer funcionar un modelo grande en un entorno verificable aún está lejos, usar soluciones similares a Oracle es un camino más práctico.

Alrededor de los Agentes de IA surgirán muchas necesidades: ¿cómo obtener conocimiento común sobre los Agentes de IA? ¿Cómo determina el Agente de IA los hechos? ¿Cómo identifica el Agente de IA a un mismo usuario en diferentes plataformas? ¿Cómo se almacena la 'memoria' en los contratos inteligentes? Si tengo varios dispositivos, cada uno con un Agente de IA, ¿cómo comparten memoria?

Te darás cuenta de que lo que se hizo en Web3, como 'subir datos a la cadena', relaciones en la cadena, DID, redes P2P, etc., tiene nuevos significados y escenarios.

Conclusión

Reutilizando mi conclusión de una charla sobre IA y blockchain del 21, un internet más amigable con la IA también es un internet más amigable con la humanidad. En ese entonces solo era una idea loca, pero ahora el futuro ha llegado.