Artículo reimpreso de: ChainFeeds
Autor: 0XNATALIE
Desde la segunda mitad de este año, el tema del AI Agent ha ido en aumento. Al principio, el chatbot de AI terminal of truths atrajo mucha atención por sus publicaciones y respuestas humorísticas en X (similar a 'Robert' en Weibo) y recibió una financiación de 50,000 dólares del fundador de a16z, Marc Andreessen. Inspirados por su contenido, algunos crearon el token GOAT, que aumentó más del 10,000% en solo 24 horas. El tema del AI Agent captó inmediatamente la atención de la comunidad de Web3. Luego, apareció el primer fondo de trading AI descentralizado basado en Solana, ai16z, que lanzó el marco de desarrollo de AI Agent Eliza, lo que generó una disputa sobre tokens en mayúsculas y minúsculas. Sin embargo, la comunidad aún no tiene claro el concepto de AI Agent: ¿cuál es su núcleo? ¿En qué se diferencia de los bots de trading de Telegram?
Principio de funcionamiento: percepción, razonamiento y toma de decisiones autónomas
El AI Agent es un sistema de agente inteligente basado en modelos de lenguaje de gran tamaño (LLM), capaz de percibir el entorno, tomar decisiones razonadas y completar tareas complejas mediante la invocación de herramientas o la ejecución de operaciones. Flujo de trabajo: módulo de percepción (obtención de entrada) → LLM (comprensión, razonamiento y planificación) → invocación de herramientas (ejecución de tareas) → retroalimentación y optimización (validación y ajuste).
Específicamente, el AI Agent primero obtiene datos del entorno externo a través de un módulo de percepción (como texto, audio, imágenes, etc.), y los convierte en información estructurada que puede ser procesada. LLM, como componente central, proporciona una poderosa capacidad de comprensión y generación de lenguaje natural, actuando como el 'cerebro' del sistema. Basándose en los datos de entrada y el conocimiento existente, LLM realiza inferencias lógicas, generando posibles soluciones o estableciendo planes de acción. Luego, el AI Agent completa tareas específicas mediante la invocación de herramientas externas, plugins o APIs, y valida y ajusta los resultados según los comentarios, formando una optimización en bucle cerrado.
En el contexto de aplicación de Web3, ¿cuál es la diferencia entre AI Agent y bots de trading de Telegram o scripts automatizados? Por ejemplo, en el arbitraje, el usuario desea realizar transacciones de arbitraje bajo la condición de que el beneficio sea mayor al 1%. En los bots de trading de Telegram que admiten arbitraje, el usuario establece la estrategia de transacción de beneficio mayor al 1%, y el bot comienza a ejecutar. Sin embargo, cuando el mercado es volátil y las oportunidades de arbitraje cambian constantemente, estos bots carecen de la capacidad de evaluación de riesgos; ejecutan arbitrajes siempre que se cumple la condición de beneficio mayor al 1%. En comparación, el AI Agent puede ajustar automáticamente su estrategia. Por ejemplo, cuando el beneficio de una transacción supera el 1%, pero el análisis de datos evalúa que el riesgo es demasiado alto y el mercado podría cambiar repentinamente, causando pérdidas, decidirá no ejecutar esa transacción de arbitraje.
Por lo tanto, el AI Agent tiene auto-adaptabilidad, su ventaja central radica en su capacidad para auto-aprender y tomar decisiones autónomas, interactuando con el entorno (como el mercado, el comportamiento del usuario, etc.), ajustando su estrategia de comportamiento según las señales de retroalimentación, mejorando continuamente la efectividad de la ejecución de tareas. También puede tomar decisiones en tiempo real basadas en datos externos y optimizar continuamente su estrategia de decisiones a través del aprendizaje por refuerzo.
¿Esto suena un poco como un solucionador dentro del marco de intenciones (slover)? El AI Agent en sí mismo también es un producto basado en intenciones, la principal diferencia con el solucionador del marco de intenciones es que el solucionador se basa en algoritmos precisos, con rigurosidad matemática, mientras que la toma de decisiones del AI Agent depende del entrenamiento de datos, a menudo requiere acercarse a la solución óptima a través de prueba y error continuo durante el proceso de entrenamiento.
Marcos de AI Agent principales
El marco de AI Agent es la infraestructura utilizada para crear y gestionar agentes inteligentes. Actualmente, en Web3, los marcos más populares incluyen Eliza de ai16z, ZerePy de zerebro y GAME de Virtuals.
Eliza es un marco de AI Agent multifuncional, construido con TypeScript, que admite la ejecución en múltiples plataformas (como Discord, Twitter, Telegram, etc.) y, a través de una compleja gestión de memoria, puede recordar conversaciones y contextos anteriores, manteniendo características de personalidad y respuestas de conocimiento consistentes y estables. Eliza utiliza un sistema RAG (Generación Aumentada por Recuperación), que puede acceder a bases de datos o recursos externos para generar respuestas más precisas. Además, Eliza integra un plugin TEE, permitiendo su despliegue en TEE, garantizando la seguridad y la privacidad de los datos.
GAME es el marco que empodera y guía a los AI Agents para tomar decisiones y acciones autónomas. Los desarrolladores pueden personalizar el comportamiento de los agentes según sus necesidades, ampliar sus funciones y proporcionar operaciones personalizadas (como publicaciones y respuestas en redes sociales, etc.). Las diferentes funciones dentro del marco, como la ubicación del entorno y las tareas del agente, se dividen en múltiples módulos, lo que facilita la configuración y gestión por parte de los desarrolladores. El marco GAME divide el proceso de toma de decisiones del AI Agent en dos niveles: Planificación de alto nivel (HLP) y Planificación de bajo nivel (LLP), cada uno responsable de diferentes niveles de tareas y decisiones. La planificación de alto nivel se encarga de establecer los objetivos generales y la planificación de tareas del agente, formulando decisiones basadas en objetivos, personalidad, información de contexto y estado del entorno, determinando la prioridad de las tareas. La planificación de bajo nivel se centra en la ejecución, convirtiendo las decisiones de la planificación de alto nivel en pasos de acción concretos, eligiendo las funciones y métodos de operación adecuados.
ZerePy es un marco de Python de código abierto, utilizado para desplegar AI Agents en X. Este marco integra LLM proporcionados por OpenAI y Anthropic, permitiendo a los desarrolladores construir y gestionar agentes en redes sociales, automatizando la ejecución de acciones como publicar tweets, responder tweets, dar 'me gusta', etc. Cada tarea puede configurarse con diferentes pesos según su importancia. ZerePy ofrece una interfaz de línea de comandos (CLI) sencilla, facilitando a los desarrolladores iniciar y gestionar agentes rápidamente. Además, el marco proporciona plantillas de Replit (una plataforma de edición y ejecución de código en línea), que permiten a los desarrolladores comenzar a usar ZerePy rápidamente, sin necesidad de configuraciones locales complejas.
¿Por qué los AI Agents enfrentan FUD?
El AI Agent parece inteligente, capaz de reducir la barrera de entrada y mejorar la experiencia del usuario, ¿por qué hay FUD en la comunidad? La razón es que, en esencia, el AI Agent sigue siendo una herramienta, actualmente no puede completar todo el flujo de trabajo, solo puede mejorar la eficiencia y ahorrar tiempo en ciertos nodos. Además, en la etapa actual, el papel del AI Agent se centra en ayudar a los usuarios a emitir MeMe y gestionar cuentas de redes sociales con un solo clic. La comunidad bromea diciendo 'los activos pertenecen a los desarrolladores, las responsabilidades pertenecen a la IA'.
Sin embargo, esta semana, aiPool lanzó un AI Agent como preventa de token, utilizando tecnología TEE para lograr la desconfianza. La clave privada de la billetera de este AI Agent se genera dinámicamente en el entorno TEE, asegurando la seguridad. Los usuarios pueden enviar fondos (por ejemplo, SOL) a la billetera controlada por el AI Agent, que luego crea tokens según reglas establecidas y lanza un pool de liquidez en DEX, distribuyendo los tokens a los inversores que cumplen con los requisitos. Todo el proceso se lleva a cabo sin depender de intermediarios de terceros, completamente realizado por el AI Agent de manera autónoma en el entorno TEE, evitando el riesgo común de rug pulls en DeFi. Esto demuestra que el AI Agent está en desarrollo. Creo que el AI Agent puede ayudar a los usuarios a reducir la barrera de entrada y mejorar la experiencia, incluso si solo simplifica parte del proceso de emisión de activos, es significativo. Pero desde una perspectiva macro de Web3, el AI Agent, como producto fuera de la cadena, en esta etapa solo actúa como herramienta auxiliar de contratos inteligentes, por lo que no es necesario exagerar sus capacidades. Dado que en la segunda mitad de este año, fuera de MeMe, ha faltado una narrativa significativa de efecto riqueza, es normal que el hype del AI Agent se centre alrededor de MeMe. Solo con MeMe no se puede mantener un valor a largo plazo, así que si el AI Agent puede aportar más innovaciones al proceso de transacción, proporcionando un valor tangible, podría convertirse en una herramienta infra generalizada.