Autor: 0XNATALIE
Desde la segunda mitad de este año, el tema del Agente AI ha seguido ganando popularidad. Al principio, el chatbot AI terminal of truths atrajo mucha atención por sus publicaciones y respuestas humorísticas en X (similar al 'Robert' de Weibo), y recibió una financiación de 50,000 dólares del fundador de a16z, Marc Andreessen. Inspirados por su contenido, se creó el token GOAT, que aumentó más del 10,000% en solo 24 horas. El tema del Agente AI llamó la atención de la comunidad Web3. Luego, se lanzó el primer fondo de inversión descentralizado de AI basado en Solana, ai16z, que presentó el marco de desarrollo de Agente AI, Eliza, y provocó una disputa sobre tokens mayúsculas y minúsculas. Sin embargo, la comunidad aún no tiene claro el concepto de Agente AI: ¿cuál es su núcleo? ¿En qué se diferencia de los bots de trading de Telegram?
Principio de funcionamiento: percepción, razonamiento y toma de decisiones autónoma
El Agente AI es un sistema de agente inteligente basado en modelos de lenguaje de gran tamaño (LLM), capaz de percibir el entorno, tomar decisiones razonadas y completar tareas complejas mediante la invocación de herramientas o la ejecución de acciones. Flujo de trabajo: módulo de percepción (obtener entradas) → LLM (comprensión, razonamiento y planificación) → invocación de herramientas (ejecución de tareas) → retroalimentación y optimización (validación y ajuste).
Específicamente, el Agente AI primero obtiene datos del entorno externo a través del módulo de percepción (como texto, audio, imágenes, etc.) y los transforma en información estructurada que puede ser procesada. El LLM, como componente central, proporciona una poderosa capacidad de comprensión y generación de lenguaje natural, actuando como el 'cerebro' del sistema. Basándose en los datos de entrada y el conocimiento existente, el LLM realiza razonamientos lógicos, genera posibles soluciones o formula planes de acción. Luego, el Agente AI completa tareas específicas invocando herramientas externas, complementos o APIs, y valida y ajusta los resultados según la retroalimentación, formando un ciclo de optimización.
En los escenarios de aplicación de Web3, ¿cuál es la diferencia entre el Agente AI y los bots de trading de Telegram o los scripts automatizados? Tomemos el arbitraje como ejemplo, donde los usuarios desean realizar operaciones de arbitraje siempre que el beneficio sea superior al 1%. En los bots de trading de Telegram que admiten arbitraje, los usuarios configuran una estrategia de trading con un beneficio superior al 1%, y el bot comienza a ejecutar. Sin embargo, cuando el mercado fluctúa con frecuencia y las oportunidades de arbitraje cambian constantemente, estos bots carecen de capacidad de evaluación de riesgos y ejecutan el arbitraje siempre que se cumpla la condición de beneficio superior al 1%. En comparación, el Agente AI puede ajustar automáticamente su estrategia. Por ejemplo, cuando el beneficio de una operación supera el 1%, pero a través del análisis de datos se evalúa que el riesgo es demasiado alto, el mercado podría cambiar repentinamente, lo que resulta en pérdidas, y decidirá no ejecutar ese arbitraje.
Por lo tanto, el Agente AI tiene auto-adaptabilidad, su ventaja principal radica en su capacidad para auto-aprender y tomar decisiones autónomas, interactuando con el entorno (como el mercado, el comportamiento del usuario, etc.) y ajustando su estrategia de comportamiento según las señales de retroalimentación, mejorando continuamente la efectividad de la ejecución de tareas. También puede tomar decisiones en tiempo real basadas en datos externos y optimizar continuamente su estrategia de decisión a través del aprendizaje por refuerzo.
¿No suena un poco como un solucionador (solver) bajo un marco de intenciones? El Agente AI también es un producto basado en intenciones, y la mayor diferencia con el solucionador bajo el marco de intenciones es que el solucionador se basa en algoritmos precisos, con rigor matemático, mientras que la toma de decisiones del Agente AI depende del entrenamiento de datos, lo que a menudo requiere acercarse a la solución óptima mediante prueba y error durante el proceso de entrenamiento.
Marco principal del Agente AI
El marco del Agente AI es la infraestructura utilizada para crear y gestionar agentes inteligentes. Actualmente, en Web3, los marcos más populares incluyen Eliza de ai16z, ZerePy de zerebro y GAME de Virtuals.
Eliza es un marco de Agente AI multifuncional, construido con TypeScript, que admite la ejecución en varias plataformas (como Discord, Twitter, Telegram, etc.) y, mediante una gestión de memoria compleja, puede recordar conversaciones y contextos anteriores, manteniendo características de personalidad y respuestas de conocimiento consistentes y estables. Eliza utiliza un sistema RAG (Generación Aumentada por Recuperación), que puede acceder a bases de datos o recursos externos para generar respuestas más precisas. Además, Eliza integra un complemento TEE, permitiendo su implementación en TEE, asegurando así la seguridad y privacidad de los datos.
GAME es el marco que empodera y motiva al Agente AI a tomar decisiones y acciones autónomas. Los desarrolladores pueden personalizar el comportamiento del agente según sus necesidades, expandir sus funciones y proporcionar operaciones personalizadas (como publicaciones en redes sociales, respuestas, etc.). Las diferentes funciones en el marco, como la ubicación del entorno del agente y las tareas, se dividen en múltiples módulos para facilitar la configuración y gestión por parte de los desarrolladores. El marco GAME divide el proceso de toma de decisiones del Agente AI en dos niveles: planificación de alto nivel (HLP) y planificación de bajo nivel (LLP), responsables de diferentes niveles de tareas y decisiones. La planificación de alto nivel establece los objetivos generales del agente y la planificación de tareas, formulando decisiones basadas en objetivos, personalidad, información de contexto y el estado del entorno, determinando la prioridad de las tareas. La planificación de bajo nivel se centra en la ejecución, transformando las decisiones de planificación de alto nivel en pasos operativos concretos, eligiendo las funciones y métodos operativos adecuados.
ZerePy es un marco de Python de código abierto para implementar Agentes AI en X. Este marco integra los LLM proporcionados por OpenAI y Anthropic, permitiendo a los desarrolladores construir y gestionar agentes de redes sociales, automatizando acciones como publicar tweets, responder tweets, dar me gusta, etc. Cada tarea puede configurarse con diferentes pesos según su importancia. ZerePy ofrece una interfaz de línea de comandos (CLI) sencilla, facilitando a los desarrolladores iniciar y gestionar agentes rápidamente. Además, el marco proporciona una plantilla de Replit (una plataforma en línea para editar y ejecutar código), permitiendo a los desarrolladores comenzar a usar ZerePy sin necesidad de configuraciones complejas en el entorno local.
¿Por qué el Agente AI enfrenta FUD?
El Agente AI parece inteligente, puede reducir las barreras de entrada y mejorar la experiencia del usuario, ¿por qué hay FUD en la comunidad? La razón es que, en esencia, el Agente AI sigue siendo solo una herramienta, actualmente no puede completar todo el flujo de trabajo, solo puede mejorar la eficiencia y ahorrar tiempo en ciertos nodos. Además, en la etapa de desarrollo actual, el papel del Agente AI se centra principalmente en ayudar a los usuarios a emitir MeMe con un solo clic y gestionar cuentas de redes sociales. La comunidad se burla diciendo 'los activos pertenecen a los desarrolladores, los pasivos pertenecen a la IA'.
Sin embargo, esta semana, aiPool lanzó el Agente AI como preventa de token, utilizando tecnología TEE para lograr la desconfianza. La clave privada de la billetera de este Agente AI se genera dinámicamente en un entorno TEE, asegurando la seguridad. Los usuarios pueden enviar fondos (por ejemplo, SOL) a la billetera controlada por el Agente AI, que luego crea tokens según reglas establecidas y lanza un pool de liquidez en DEX, distribuyendo tokens a los inversores que cumplan con los requisitos. Todo el proceso se realiza sin depender de intermediarios de terceros, completado completamente por el Agente AI en un entorno TEE, evitando el riesgo común de 'rug pull' en DeFi. Es evidente que el Agente AI está desarrollándose gradualmente. Creo que el Agente AI puede ayudar a los usuarios a reducir barreras y mejorar experiencias, incluso si solo simplifica parte del proceso de emisión de activos, es significativo. Pero desde una perspectiva macro de Web3, el Agente AI, como producto fuera de la cadena, en esta etapa solo actúa como una herramienta auxiliar para contratos inteligentes, por lo que no es necesario exagerar sus capacidades. Dado que, en la segunda mitad de este año, además de MeMe, falta una narrativa significativa de efecto riqueza, es normal que el hype del Agente AI gire en torno a MeMe. Depender únicamente de MeMe no puede mantener un valor a largo plazo, por lo que si el Agente AI puede aportar más innovaciones en el proceso de trading y proporcionar un valor tangible, podría convertirse en una herramienta infra generalizada.