Título original: (Era de los Agentes: El enfrentamiento y la coexistencia de IA y Crypto)
Autor original: YBB Capital Research
Uno, el nuevo y viejo deseo de atención
En el último año, debido a la falta de narrativas en la capa de aplicación, que no puede coincidir con la velocidad de explosión de la infraestructura, el campo de las criptomonedas se ha convertido gradualmente en un juego por los recursos de atención. Desde Silly Dragon hasta Goat, desde Pump.fun hasta Clanker, el nuevo y viejo deseo de atención ha llevado a esta batalla por los recursos a una intensa competencia. Comenzando con la forma más común de monetización a través de atraer la atención, rápidamente evolucionó hacia un modelo de plataforma donde se unifican los demandantes y proveedores de atención, y luego los seres de silicio se convierten en nuevos proveedores de contenido. En la variedad de formas de Meme Coin, finalmente ha surgido una existencia que puede alcanzar un consenso entre minoristas y VC: el Agente de IA.
La atención, en última instancia, es un juego de suma cero, pero la especulación también puede fomentar el crecimiento salvaje de las cosas. En nuestro artículo sobre UNI, revisamos el inicio de la antigua era dorada de blockchain, el crecimiento acelerado de DeFi se originó en la era de extracción de LP iniciada por Compound Finance, entrar y salir de varios grupos de minería con APYs de miles o incluso decenas de miles fue la forma más primitiva de juego en cadena en ese momento, aunque la situación final fue el colapso de varios grupos. Pero la locura de los mineros de oro ciertamente dejó a blockchain con una liquidez sin precedentes, DeFi finalmente también se desprendió de la pura especulación y formó un sector maduro, satisfaciendo las necesidades financieras de los usuarios en aspectos como pagos, transacciones, arbitrajes, y staking. Mientras tanto, el Agente de IA también está atravesando esta fase salvaje, lo que estamos explorando es cómo Crypto puede fusionarse mejor con AI y finalmente permitir que la capa de aplicación alcance nuevas alturas.
Dos, ¿Cómo puede el agente ser autónomo?
En el artículo anterior, presentamos brevemente el origen del AI Meme: Truth Terminal, así como las perspectivas futuras del Agente de IA. Este artículo se centra primero en el Agente de IA.
Comencemos hablando de la definición del Agente de IA, 'Agente' es un término antiguo pero poco claro en el campo de la IA, que enfatiza principalmente la Autonomía, es decir, cualquier IA que pueda percibir su entorno y reaccionar se puede denominar Agente. En la definición actual, el Agente de IA se acerca más al concepto de agente, es decir, establecer un sistema que imite la toma de decisiones humanas para el gran modelo, que en el ámbito académico se considera la forma más prometedora para alcanzar la AGI (inteligencia artificial general).
En las primeras versiones de GPT, podíamos sentir claramente que los grandes modelos se parecían a los humanos, pero al responder muchas preguntas complejas, los grandes modelos solo podían proporcionar respuestas que parecían correctas. La razón fundamental es que los grandes modelos de ese entonces se basaban en probabilidades en lugar de causalidad, además carecían de las capacidades de uso de herramientas, memoria, planificación, etc., que poseen los humanos, y el Agente de IA puede compensar estas deficiencias. Así que para resumirlo en una fórmula: Agente de IA = LLM (gran modelo) + Planificación + Memoria + Herramientas.
Los grandes modelos basados en palabras clave (Prompt) son más como una persona estática, solo tienen vida cuando introducimos datos, el objetivo del agente es ser una persona más real. Actualmente, los agentes en el campo se basan principalmente en modelos ajustados de Llama 70b o 405b de Meta (con diferentes parámetros), que tienen la capacidad de recordar y utilizar herramientas de acceso a API, en otros aspectos pueden necesitar ayuda o entrada humana (incluida la interacción y colaboración con otros agentes), por lo que vemos que los principales agentes en la actualidad aún existen en las redes sociales en forma de KOL. Para que un agente se parezca más a un humano, necesita integrar capacidades de planificación y acción, siendo la cadena de pensamiento un elemento clave en la planificación.
Tres, Cadena de Pensamiento (Chain of Thought, CoT)
El concepto de Cadena de Pensamiento (Chain of Thought, CoT) apareció por primera vez en el artículo publicado por Google en 2022 (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), el artículo señala que se puede mejorar la capacidad de razonamiento del modelo generando una serie de pasos intermedios de razonamiento, ayudando al modelo a comprender y resolver problemas complejos de manera más efectiva.
Un típico CoT Prompt contiene tres partes: una descripción de tarea clara con instrucciones, una base lógica que respalda la solución de tareas o principios teóricos, y ejemplos de soluciones específicas. Esta forma estructurada ayuda al modelo a entender los requisitos de la tarea, acercándose a la respuesta a través del razonamiento lógico, mejorando así la eficiencia y precisión en la resolución de problemas. CoT es especialmente adecuado para tareas que requieren un análisis profundo y razonamiento de múltiples pasos, como la resolución de problemas matemáticos, redacción de informes de proyectos, etc. En tareas simples, CoT puede no ofrecer ventajas significativas, pero en tareas complejas, puede mejorar notablemente el rendimiento del modelo, reduciendo la tasa de errores mediante estrategias de resolución paso a paso y mejorando la calidad de la finalización de la tarea.
Al construir un Agente de IA, CoT juega un papel clave, el Agente de IA necesita entender la información recibida y tomar decisiones razonables en consecuencia. CoT ayuda al Agente a manejar y analizar efectivamente la información de entrada al proporcionar un método de pensamiento ordenado, convirtiendo los resultados del análisis en guías de acción concretas. Este método no solo mejora la fiabilidad y eficiencia de las decisiones del Agente, sino que también aumenta la transparencia del proceso de decisión, haciendo que el comportamiento del Agente sea más predecible y rastreable. CoT, al descomponer tareas en múltiples pequeños pasos, ayuda al Agente a considerar cuidadosamente cada punto de decisión, reduciendo errores de decisión causados por sobrecarga de información. CoT hace que el proceso de decisión del Agente sea más transparente, lo que facilita a los usuarios entender la base de las decisiones del Agente. En la interacción con el entorno, CoT permite al Agente aprender constantemente nueva información y ajustar su estrategia de comportamiento.
CoT como una estrategia efectiva no solo mejora la capacidad de razonamiento de los grandes modelos de lenguaje, sino que también juega un papel importante en la construcción de Agentes de IA más inteligentes y confiables. Al aprovechar CoT, investigadores y desarrolladores pueden crear sistemas inteligentes que se adapten mejor a entornos complejos y que posean alta autonomía. CoT ha mostrado sus ventajas únicas en aplicaciones prácticas, especialmente al manejar tareas complejas, al descomponer las tareas en una serie de pequeños pasos, no solo mejora la precisión en la solución de tareas, sino que también aumenta la interpretabilidad y controlabilidad del modelo. Este enfoque de resolver problemas paso a paso puede reducir significativamente la tasa de errores al enfrentar tareas complejas debido a la sobreabundancia o complejidad de la información. Al mismo tiempo, este método también mejora la trazabilidad y verificabilidad de toda la solución.
La función central de CoT radica en combinar planificación, acción y observación, cerrando la brecha entre razonamiento y acción. Este modo de pensamiento permite al Agente de IA formular respuestas efectivas al predecir situaciones anómalas que podrían surgir, así como acumular nueva información y verificar predicciones preestablecidas mientras interactúa con el entorno externo, proporcionando nuevas bases para el razonamiento. CoT actúa como un poderoso motor de precisión y estabilidad, ayudando al Agente de IA a mantener una alta eficiencia laboral en entornos complejos.
Cuatro, las demandas falsas correctas
¿Con qué aspectos de la pila tecnológica de IA realmente debe combinarse Crypto? En el artículo del año pasado, creí que la descentralización del cómputo y los datos era un paso clave para ayudar a pequeñas empresas y desarrolladores individuales a reducir costos, mientras que en este año, en el segmento Crypto x AI organizado por Coinbase, hemos visto divisiones más detalladas:
(1)Capa de cómputo(refiriéndose a la red que se centra en proporcionar recursos de unidad de procesamiento gráfico (GPU) para desarrolladores de IA);
(2)Capa de datos(refiriéndose a la red que apoya el acceso, orquestación y verificación descentralizados de tuberías de datos de IA);
(3)Capa de middleware(refiriéndose a la plataforma o red que apoya el desarrollo, despliegue y alojamiento de modelos o agentes de IA);
(4)Capa de aplicación(refiriéndose a productos orientados al usuario que utilizan mecanismos de IA en la cadena, ya sea B2B o B2C)。
En estas cuatro capas clasificadas, cada capa tiene una gran visión, cuyo objetivo en resumen es combatir la próxima era de dominación de los gigantes de Silicon Valley en Internet. Como mencioné el año pasado, ¿realmente debemos aceptar que los gigantes de Silicon Valley controlen exclusivamente el cómputo y los datos? Bajo su monopolio, los grandes modelos de código cerrado son una caja negra, la ciencia, como la religión más creída por la humanidad hoy, el futuro de cada frase que los grandes modelos respondan será vista como verdad por una gran parte de las personas, pero ¿cómo se verificará esta verdad? Según la visión de los gigantes de Silicon Valley, los permisos que finalmente poseerá el agente serán inimaginables, como tener el poder de pago de tu billetera, los derechos de uso del terminal, ¿cómo garantizar que las personas no tengan malas intenciones?
La descentralización es la única respuesta, pero a veces, ¿no necesitamos considerar razonablemente cuántos pagadores hay para estas grandes visiones? En el pasado, podíamos compensar los errores de idealización a través de Tokens sin considerar el ciclo comercial. Pero la situación actual es muy grave, Crypto x AI necesita combinarse con la realidad antes de diseñar, por ejemplo, ¿cómo equilibrar la oferta en ambos extremos de la capa de cómputo en condiciones de pérdida de rendimiento e inestabilidad? para lograr competitividad con la nube centralizada. ¿Cuántos usuarios reales habrá en los proyectos de la capa de datos, cómo verificar la autenticidad y efectividad de los datos proporcionados, y qué tipo de clientes necesitan estos datos? Las otras dos capas son lo mismo, en esta era no necesitamos tantas demandas falsas que parecen correctas.
Cinco, Meme ha salido de SocialFi
Como mencioné en el primer párrafo, Meme ya ha salido de manera ultrarrápida, cumpliendo con la forma SocialFi de Web3. Friend.tech fue el Dapp que disparó la primera ronda de aplicaciones sociales, pero desafortunadamente fracasó debido al diseño apresurado del Token. Pump.fun validó la viabilidad de la pura plataforma, sin hacer ningún Token, sin reglas. Los demandantes y proveedores de atención se unifican, puedes publicar memes, hacer transmisiones en vivo, emitir monedas, dejar mensajes, comerciar, todo es libre, Pump.fun solo cobra una tarifa de servicio. Esto es básicamente consistente con el modelo de economía de atención de las redes sociales actuales como YouTube, Ins, solo que los sujetos de cobro son diferentes, en términos de juego Pump.fun es más Web3.
El Clanker de Base es un integrador, gracias a la ecología que maneja personalmente la integración, Base tiene su propio Dapp social como apoyo, formando un ciclo interno completo. El agente Meme es la forma 2.0 de Meme Coin, las personas siempre buscan novedades, y Pump.fun se encuentra actualmente en la cúspide de la ola, desde la perspectiva de la tendencia, la locura de los seres de silicio reemplazando a los seres de carbono es solo cuestión de tiempo.
He mencionado Base innumerables veces, solo que cada vez el contenido mencionado es diferente, desde la línea de tiempo Base nunca ha sido un pionero, pero siempre es un ganador.
Seis, ¿Qué más pueden ser los agentes?
Desde un punto de vista pragmático, los agentes no podrán descentralizarse en un largo periodo de tiempo en el futuro. Desde la construcción de agentes en el campo de la IA tradicional, no es un problema simple que la descentralización y el código abierto resuelvan, necesita acceder a diversas API para acceder al contenido de Web2, su costo de operación es muy alto, el diseño de la cadena de pensamiento y la colaboración de múltiples agentes aún dependen de un humano como intermediario. Pasaremos por un largo período de transición, hasta que surja una forma de fusión adecuada, tal vez como UNI. Pero al igual que en el artículo anterior, sigo pensando que los agentes tendrán un gran impacto en nuestra industria, al igual que la existencia de Cex en nuestra industria, no es correcto, pero es muy importante.
El artículo (Resumen de Agentes de IA) emitido el mes pasado por Stanford y Microsoft describe en gran medida la aplicación de agentes en la industria médica, máquinas inteligentes y mundos virtuales, y en el apéndice de este artículo ya hay muchos casos de prueba de GPT-4V como agentes participando en el desarrollo de juegos AAA de primera categoría.
No es necesario exigir demasiado la velocidad de su combinación con la descentralización, prefiero que el rompecabezas que primero complete el agente sea la capacidad y velocidad de abajo hacia arriba, tenemos tantas ruinas narrativas y un metaverso en blanco que necesita ser llenado por él, en la etapa adecuada consideraremos cómo hacer que se convierta en el próximo UNI.
Referencias:
La cadena de pensamiento que 'emerge' de los grandes modelos, ¿cuál es realmente la capacidad? Autor: Cerebro extremo
Un artículo que explica a los Agentes, la próxima parada de los grandes modelos Autor: LinguaMind
Este artículo proviene de una contribución y no representa la opinión de BlockBeats.