Fuente del artículo: PA荐读
Autor: jolestar
La semana pasada jugué un poco con Agentes de IA, anteayer asistí a un evento de ai16z en Beijing, quería ver qué pueden hacer actualmente los Agentes de IA y reflexionar sobre lo que podrían hacer en el futuro.
El estado actual de los Agentes de IA me recuerda a ese meme, donde hay una persona escondida dentro de una máquina expendedora. La imagen que todos imaginan de un Agente de IA ya ha comenzado a tener conciencia propia, pero en realidad dentro de un Agente de IA hay un desarrollador escondido. (Aquí todos imaginen la imagen, intenté hacer que la IA generara esta imagen, pero descubrí que la IA no puede entender "esconder")
La forma básica de funcionamiento del marco de Agentes de IA
El marco de Agentes de IA actualmente actúa como un adhesivo, uniendo clientes (Twitter, Discord, Telegram, etc.) y diversos plugins (varias cadenas, etc.), y luego el marco proporciona una biblioteca básica (almacenamiento de memoria, aislamiento de sesiones, generación de contexto), entre otros, para posteriormente conectar diversas interfaces de plataformas de IA.
Cómo se combina el marco de Agentes de IA con aplicaciones y escenarios de negocio
Desde que la IA se volvió popular el año pasado, han surgido diversas plataformas y herramientas, y lo más crucial es resolver un problema: ¿cómo se combina la IA con las aplicaciones? Algunas plataformas de IA intentan ofrecer plugins, otras crean modelos de flujo de trabajo, y también hay aplicaciones tradicionales que integran IA dentro de ellas. Pero aquí las claves son: 1. ¿Dónde están las entradas de interacción de las aplicaciones? 2. ¿Cómo se combina la IA con la lógica de negocio existente?
Las entradas de interacción que las plataformas de IA ofrecen a los usuarios son todas cuadros de diálogo similares a ventanas de chat, y evidentemente todos creen que la forma de interactuar con las aplicaciones de IA debería ser de una manera "humanizada". En este aspecto, la inteligencia del Agente de IA radica en que se conecta directamente a todos los sistemas de mensajería instantánea abiertos y a las redes sociales, lo cual es claramente más aceptable que crear algo nuevo.
¿Cómo se combina la IA con la lógica de negocio existente? La solución que ofrece el Agente de IA es permitir que los desarrolladores integren las decisiones de IA en los escenarios de negocio. Los lenguajes de programación requieren determinismo, las condiciones if solo pueden ser true o false, y no pueden manejar la lógica de negocio difusa. Sin embargo, a través de la IA, se pueden convertir lógicas complejas en condiciones precisas, que luego se pueden integrar sin problemas en los escenarios de negocio.
Por ejemplo, la función de responder mensajes en un grupo, los bots de IM tradicionales necesitan instrucciones de mensajes claras para activarse, mientras que a través de la IA se puede implementar un método shouldReplyMessage, que le da contexto y devuelve true o false.
El papel de la IA en los escenarios de lógica de negocio es principalmente:
1. Descubrimiento de "intenciones": a través de las explicaciones en las palabras clave, se permite que la IA descubra las "intenciones" en los mensajes de texto del usuario según el contexto, mapeando la intención a código específico.
2. Asistencia en la toma de decisiones: a través de la IA, se convierten las condiciones complejas y difusas en true/false definidos o tipos enumerados, para luego integrarlas en la lógica de negocio.
Al ver esto, muchas personas pueden sentirse decepcionadas con los Agentes de IA, ya que muchos piensan que un Agente de IA es solo enseñar a la IA y ya lo sabrá todo. En realidad, debido a las limitaciones del contexto de los grandes modelos, no se puede (al menos actualmente) crear un Agente de IA universal que pueda hacer cualquier cosa. Pero la buena noticia es que los programadores no tienen que preocuparse por perder su empleo, ya que detrás de la IA aún se necesita una gran cantidad de programadores, y se necesita a alguien que se encargue de las condiciones if else, pero la diferencia clave es que los límites de los negocios que los programas pueden manejar se están expandiendo.
Dos tipos de Agentes de IA
En un evento, le pregunté a Shaw acerca de las dos expectativas del mercado sobre los Agentes de IA: 1. El Agente de IA actúa como un personaje, tiene su propio ID, marca y proporciona servicios a los usuarios. 2. El usuario tiene un Agente de IA personal, equivalente a un asistente personal, que puede ayudar al usuario a manejar algunos negocios. ¿Cuál de estos dos tipos de Agentes de IA será más popular? Él considera que ambas direcciones son buenas y también es posible que se combinen.
Actualmente, el enfoque principal en el mercado sigue siendo la primera dirección. Esta dirección es similar a la transformación de servicios en Agentes de IA, es posible que no haya una interfaz de App en el futuro, todas las Apps se habrán transformado en Agentes de IA, humanizándose. La segunda dirección es la transformación de los clientes de aplicaciones en Agentes, donde el cliente de la aplicación futura será un plugin de un Agente asistente, y los datos locales de la aplicación se convertirán en parte del repositorio de memoria del Agente, mientras que este plugin también será responsable de comunicarse con el Agente de servicio en la nube. Esta es una nueva arquitectura de aplicación que cambiará toda la infraestructura.
Los requisitos de los Agentes de IA para la infraestructura
1. La infraestructura debe lograr un umbral de entrada sin permisos (Permissionless), de lo contrario, los Agentes de IA serán limitados por diversas estrategias de defensa contra ataques, y el servicio debe utilizar un método de costo económico (Gas) para prevenir ataques. En este sentido, las plataformas con menor grado de apertura enfrentarán un gran impacto, y el fervor por las plataformas abiertas de la era temprana de Web2 se reavivará.
2. El Agente de IA necesita poder operar con fondos para pagar, con el fin de resolver los problemas mencionados anteriormente.
Es decir, los servicios futuros, ya sean basados en blockchain o no, necesitarán soportar la autenticación de identidad basada en claves privadas de Crypto y pagos basados en Crypto.
La combinación de Agentes de IA y cadenas
Además de los dos puntos mencionados, cómo se combinan los Agentes de IA con las cadenas es una dirección que todos están explorando. En el evento, hablé con Mikkke sobre su proyecto focEliza. Las dos clases de Agentes de IA mencionadas anteriormente, al menos la primera, necesitan un entorno de ejecución o verificación proporcionado por la cadena. Porque una vez que un Agente de IA ofrece servicios externamente, surge un problema de confianza, su papel es en realidad similar al de un contrato inteligente.
Hubo una controversia sobre el nombre "contrato inteligente", ya que solo es un fragmento de código, ¿dónde está lo "inteligente"? La IA puede hacer que los contratos inteligentes sean realmente inteligentes. El desafío es cómo llamar a la interfaz de IA en el entorno de contratos inteligentes. Si se dice que hacer que un gran modelo funcione en un entorno verificable aún está lejos, usar soluciones similares a las de Oracle es un camino más práctico.
Y alrededor de los Agentes de IA surgirán muchas demandas, ¿cómo se obtiene el conocimiento público de los Agentes de IA? ¿Cómo determina un Agente de IA los hechos? ¿Cómo puede un Agente de IA identificar al mismo usuario en diferentes plataformas? ¿Cómo se almacenan los "recuerdos" en los contratos inteligentes? Si tengo varios dispositivos, cada uno con un Agente de IA, ¿cómo compartirán la memoria?
Te darás cuenta de que lo que se ha hecho en Web3, como "datos en la cadena", relaciones en la cadena, DID, redes P2P, etc., tiene nuevos significados y escenarios.
Conclusión
Reutilizando la conclusión de una charla sobre IA y blockchain que di en 2021, un internet más amigable con la IA también es un internet más amigable con la humanidad. En ese momento era solo una idea, pero ahora el futuro ha llegado.