Autor: 0XNATALIE

Desde la segunda mitad de este año, el tema del agente de IA ha estado en constante aumento. Al principio, el chatbot de IA terminal of truths ganó gran atención debido a sus publicaciones y respuestas humorísticas en X (similar a "Robert" en Weibo) y recibió una financiación de 50,000 dólares del fundador de a16z, Marc Andreessen. Inspirados por su contenido, alguien creó el token GOAT, que aumentó más del 10,000% en solo 24 horas. El tema del agente de IA rápidamente atrajo la atención de la comunidad Web3. Luego, nació el primer fondo de comercio descentralizado de IA basado en Solana, ai16z, que lanzó el marco de desarrollo de agentes de IA Eliza, provocando una disputa por tokens de mayúsculas y minúsculas. Sin embargo, el concepto de agente de IA aún no está claro para la comunidad: ¿cuál es realmente el núcleo del agente de IA? ¿En qué se diferencia de los bots de comercio de Telegram?

Principio de funcionamiento: percepción, razonamiento y toma de decisiones autónoma

El agente de IA es un sistema de agente inteligente basado en modelos de lenguaje de gran tamaño (LLM), capaz de percibir el entorno, tomar decisiones de razonamiento y completar tareas complejas mediante la invocación de herramientas o la ejecución de operaciones. Flujo de trabajo: módulo de percepción (obtener entradas) → LLM (comprensión, razonamiento y planificación) → llamada a herramientas (ejecución de tareas) → retroalimentación y optimización (validación y ajuste).

Específicamente, el agente de IA primero obtiene datos del entorno externo a través de un módulo de percepción (como texto, audio, imágenes, etc.) y los convierte en información estructurada que puede ser procesada. El LLM, como componente central, proporciona poderosas capacidades de comprensión y generación de lenguaje natural, actuando como el "cerebro" del sistema. Basado en los datos ingresados y el conocimiento existente, el LLM realiza inferencias lógicas, generando posibles soluciones o formulando planes de acción. Luego, el agente de IA completa tareas específicas llamando herramientas, plugins o API, y valida y ajusta los resultados según los comentarios, formando un ciclo de optimización cerrado.

En el escenario de aplicación de Web3, ¿cuál es la diferencia entre el agente de IA y los bots de comercio de Telegram o scripts automatizados? Tomando el arbitraje como ejemplo, los usuarios desean realizar operaciones de arbitraje bajo la condición de que las ganancias sean superiores al 1%. En un bot de comercio de Telegram que admite arbitraje, el usuario configura la estrategia de comercio con ganancias superiores al 1% y el bot comienza a ejecutar. Sin embargo, cuando el mercado tiene fluctuaciones frecuentes y las oportunidades de arbitraje cambian constantemente, estos bots carecen de la capacidad de evaluación de riesgos; siempre que se cumpla la condición de ganancias superiores al 1%, ejecutan el arbitraje. En comparación, el agente de IA puede ajustar automáticamente la estrategia. Por ejemplo, cuando las ganancias de una operación superan el 1%, pero a través del análisis de datos se evalúa que el riesgo es demasiado alto, y el mercado podría cambiar repentinamente causando pérdidas, decidirá no ejecutar esa operación de arbitraje.

Por lo tanto, el agente de IA tiene auto-adaptabilidad, su principal ventaja radica en su capacidad de auto-aprendizaje y toma de decisiones autónomas, interactuando con el entorno (como el mercado, el comportamiento del usuario, etc.), ajustando su estrategia de comportamiento en función de las señales de retroalimentación, mejorando continuamente la eficacia de la ejecución de tareas. También puede tomar decisiones en tiempo real basadas en datos externos y optimizar continuamente las estrategias de decisión a través del aprendizaje por refuerzo.

¿No suena un poco como un solucionador (solver) bajo un marco de intenciones? El agente de IA en sí mismo también es un producto basado en intenciones, la mayor diferencia con el solucionador bajo el marco de intenciones es que el solucionador depende de algoritmos precisos, teniendo una rigurosidad matemática, mientras que la toma de decisiones del agente de IA depende del entrenamiento de datos, lo que a menudo requiere un proceso de prueba y error continuo para acercarse a la solución óptima.

Marcos principales de agentes de IA

El marco del agente de IA es la infraestructura utilizada para crear y gestionar agentes inteligentes. Actualmente, en Web3, los marcos más populares incluyen Eliza de ai16z, ZerePy de zerebro y GAME de Virtuals.

Eliza es un marco de agente de IA multifuncional, construido con TypeScript, que admite la ejecución en múltiples plataformas (como Discord, Twitter, Telegram, etc.) y, a través de una gestión compleja de la memoria, puede recordar conversaciones y contextos anteriores, manteniendo características de personalidad y respuestas de conocimiento estables y consistentes. Eliza utiliza un sistema RAG (Generación Aumentada por Recuperación), que le permite acceder a bases de datos o recursos externos para generar respuestas más precisas. Además, Eliza integra un plugin TEE, que permite el despliegue en TEE, asegurando la seguridad y privacidad de los datos.

GAME es el marco que potencia y impulsa al agente de IA a tomar decisiones y acciones autónomas. Los desarrolladores pueden personalizar el comportamiento del agente según sus necesidades, expandir sus funciones y proporcionar operaciones personalizadas (como publicaciones en redes sociales, respuestas, etc.). Las diferentes funciones en el marco, como la ubicación y las tareas del agente, se dividen en varios módulos, lo que facilita a los desarrolladores la configuración y gestión. El marco GAME divide el proceso de toma de decisiones del agente de IA en dos niveles: planificación de alto nivel (HLP) y planificación de bajo nivel (LLP), que son responsables de diferentes niveles de tareas y decisiones. La planificación de alto nivel se encarga de establecer los objetivos generales del agente y la planificación de tareas, tomando decisiones basadas en objetivos, personalidad, información de contexto y estado ambiental, y determinando la prioridad de las tareas. La planificación de bajo nivel se centra en el aspecto de ejecución, convirtiendo las decisiones de la planificación de alto nivel en pasos de operación concretos, seleccionando funciones y métodos de operación adecuados.

ZerePy es un marco de Python de código abierto, diseñado para desplegar agentes de IA en X. Este marco integra LLM proporcionados por OpenAI y Anthropic, permitiendo a los desarrolladores construir y gestionar agentes de redes sociales, automatizando operaciones como publicar tweets, responder tweets, dar likes, etc. Cada tarea puede configurarse con diferentes pesos según su importancia. ZerePy proporciona una interfaz de línea de comandos (CLI) sencilla, facilitando a los desarrolladores iniciar y gestionar agentes rápidamente. Además, el marco ofrece una plantilla de Replit (una plataforma de edición y ejecución de código en línea), permitiendo a los desarrolladores comenzar rápidamente a usar ZerePy sin necesidad de complejas configuraciones de entorno local.

¿Por qué el agente de IA enfrenta FUD?

El agente de IA parece inteligente, capaz de reducir la barrera de entrada y mejorar la experiencia del usuario. ¿Por qué hay FUD en la comunidad? La razón es que, en esencia, el agente de IA sigue siendo solo una herramienta, actualmente no puede completar todo el flujo de trabajo, solo puede mejorar la eficiencia y ahorrar tiempo en ciertos puntos. Además, en la etapa actual de desarrollo, el papel del agente de IA se centra principalmente en ayudar a los usuarios a emitir MeMe con un solo clic y gestionar cuentas de redes sociales. La comunidad bromea que "los activos pertenecen a los desarrolladores, las responsabilidades pertenecen a la IA".

Sin embargo, esta semana, aiPool lanzó un agente de IA como preventa de tokens, utilizando tecnología TEE para lograr la desconfianza. La clave privada de la billetera de este agente de IA se genera dinámicamente en un entorno TEE, garantizando la seguridad. Los usuarios pueden enviar fondos (por ejemplo, SOL) a la billetera controlada por el agente de IA, que luego crea tokens según reglas establecidas y lanza un grupo de liquidez en DEX, al mismo tiempo que distribuye tokens a los inversores calificados. Todo el proceso no depende de ningún intermediario de terceros, siendo completado completamente por el agente de IA en un entorno TEE, evitando así el riesgo común de rug pull en DeFi. Es evidente que el agente de IA está evolucionando gradualmente. Creo que el agente de IA puede ayudar a los usuarios a reducir barreras y mejorar la experiencia, incluso si solo simplifica parte del proceso de emisión de activos, es significativo. Pero desde una perspectiva macro de Web3, el agente de IA, como un producto fuera de la cadena, en esta etapa solo actúa como una herramienta auxiliar para los contratos inteligentes, por lo que no es necesario exagerar sus capacidades. Debido a que, en la segunda mitad de este año, además de MeMe, ha faltado una narrativa significativa de efecto riqueza, es normal que el hype del agente de IA se desarrolle alrededor de MeMe. Solo con MeMe no se puede mantener un valor a largo plazo, por lo que si el agente de IA puede aportar más innovaciones en el proceso de transacciones, proporcionando un valor tangible, podría convertirse en una herramienta infra general.