Dalla seconda metà di quest'anno, il tema degli AI Agent ha continuato a guadagnare attenzione. Inizialmente, il chatbot AI terminal of truths ha attirato molta attenzione grazie ai suoi post e risposte umoristiche su X (simile a 'Robert' su Weibo), ricevendo un finanziamento di 50.000 dollari dal fondatore di a16z, Marc Andreessen. Ispirati dai suoi contenuti pubblicati, è stato creato il token GOAT, che in sole 24 ore ha avuto un aumento di oltre il 10.000%. Il tema degli AI Agent ha quindi catturato l'interesse della comunità Web3. Successivamente, è stato lanciato il primo fondo di investimento decentralizzato basato su Solana, ai16z, che ha introdotto il framework di sviluppo per AI Agent, Eliza, dando origine a una competizione tra token di varia grandezza. Tuttavia, la comunità non ha ancora una chiara comprensione del concetto di AI Agent: qual è esattamente il suo nucleo? In che modo si differenzia dai bot di trading su Telegram?
Funzionamento: percezione, ragionamento e decisione autonoma
AI Agent è un sistema di agenti intelligenti basato su modelli di linguaggio di grandi dimensioni (LLM), in grado di percepire l'ambiente, prendere decisioni logiche e completare compiti complessi attraverso l'uso di strumenti o l'esecuzione di operazioni. Flusso di lavoro: modulo di percezione (acquisizione input) → LLM (comprensione, ragionamento e pianificazione) → chiamata agli strumenti (esecuzione del compito) → feedback e ottimizzazione (verifica e adattamento).
In particolare, l'AI Agent prima acquisisce dati dall'ambiente esterno (come testo, audio, immagini, ecc.) attraverso il modulo di percezione e li trasforma in informazioni strutturate che possono essere elaborate. LLM, come componente centrale, fornisce potenti capacità di comprensione e generazione del linguaggio naturale, fungendo da 'cervello' del sistema. Basandosi sui dati in input e sulle conoscenze esistenti, LLM esegue ragionamenti logici, genera possibili soluzioni o formula piani d'azione. Successivamente, l'AI Agent completa compiti specifici richiamando strumenti esterni, plugin o API e verifica e adatta i risultati in base ai feedback, formando un ciclo di ottimizzazione.
Qual è la differenza tra AI Agent e bot di trading su Telegram o script automatizzati nel contesto delle applicazioni Web3? Prendendo come esempio l'arbitraggio, un utente desidera effettuare operazioni di arbitraggio a condizione che il profitto sia superiore all'1%. Nei bot di trading su Telegram che supportano l'arbitraggio, l'utente imposta una strategia di trading con profitto superiore all'1% e il bot inizia ad eseguire. Tuttavia, quando il mercato è soggetto a frequenti fluttuazioni e le opportunità di arbitraggio cambiano continuamente, questi bot mancano di capacità di valutazione del rischio e eseguono l'arbitraggio non appena la condizione del profitto superiore all'1% è soddisfatta. Al contrario, l'AI Agent può adattare automaticamente le proprie strategie. Ad esempio, quando il profitto di una transazione supera l'1%, ma analizzando i dati si valuta che il rischio è troppo elevato, e il mercato potrebbe cambiare improvvisamente causando una perdita, deciderà di non eseguire quel arbitraggio.
Pertanto, l'AI Agent ha la capacità di adattamento autonomo; il suo principale vantaggio risiede nella capacità di apprendere autonomamente e prendere decisioni indipendenti. Attraverso l'interazione con l'ambiente (come il mercato, il comportamento degli utenti, ecc.), l'AI Agent regola le strategie comportamentali in base ai segnali di feedback, migliorando continuamente l'efficacia dell'esecuzione dei compiti. Può anche prendere decisioni in tempo reale basate su dati esterni e ottimizzare continuamente le proprie strategie decisionali attraverso l'apprendimento per rinforzo.
Dopo tutto questo, non sembra un po' come un risolutore nel contesto dei framework di intenzione? L'AI Agent stesso è anche un prodotto basato sull'intenzione; la principale differenza rispetto ai risolutori nei framework di intenzione è che i risolutori si basano su algoritmi precisi, con rigore matematico, mentre le decisioni dell'AI Agent dipendono dall'addestramento dei dati, richiedendo spesso un processo di tentativi ed errori per avvicinarsi alla soluzione ottimale.
Framework principali dell'AI Agent
Il framework dell'AI Agent è l'infrastruttura utilizzata per creare e gestire agenti intelligenti. Attualmente, in Web3, i framework più popolari includono Eliza di ai16z, ZerePy di zerebro e GAME di Virtuals.
Eliza è un framework AI Agent multifunzionale, costruito con TypeScript, che supporta l'esecuzione su più piattaforme (come Discord, Twitter, Telegram, ecc.) e, attraverso una gestione complessa della memoria, è in grado di ricordare le conversazioni precedenti e il contesto, mantenendo caratteristiche di personalità e risposte coerenti. Eliza adotta un sistema RAG (Retrieval Augmented Generation), che consente di accedere a database o risorse esterne per generare risposte più accurate. Inoltre, Eliza integra plugin TEE, consentendo il deployment in TEE per garantire la sicurezza e la privacy dei dati.
GAME è il framework che abilita e guida l'AI Agent a prendere decisioni e azioni autonome. Gli sviluppatori possono personalizzare il comportamento degli agenti secondo le proprie esigenze, estendendo le loro funzionalità e fornendo operazioni personalizzate (come pubblicazioni sui social media, risposte, ecc.). Le diverse funzionalità nel framework, come la posizione ambientale e i compiti degli agenti, sono suddivise in più moduli, facilitando la configurazione e la gestione da parte degli sviluppatori. Il framework GAME divide il processo decisionale dell'AI Agent in due livelli: pianificazione di alto livello (HLP) e pianificazione di basso livello (LLP), responsabili rispettivamente di compiti e decisioni a diversi livelli. La pianificazione di alto livello stabilisce gli obiettivi generali e la pianificazione dei compiti dell'agente, prendendo decisioni in base a obiettivi, personalità, informazioni di contesto e stato ambientale, determinando le priorità dei compiti. La pianificazione di basso livello si concentra sull'esecuzione, trasformando le decisioni di alto livello in passaggi operativi specifici e scegliendo le funzionalità e i metodi operativi appropriati.
ZerePy è un framework Python open-source per il deployment di AI Agent su X. Questo framework integra LLM forniti da OpenAI e Anthropic, consentendo agli sviluppatori di costruire e gestire agenti sui social media, automatizzando operazioni come la pubblicazione di tweet, la risposta a tweet, il like, ecc. Ogni compito può avere pesi diversi in base alla sua importanza. ZerePy fornisce un'interfaccia a riga di comando (CLI) semplice, facilitando l'avvio e la gestione rapida degli agenti da parte degli sviluppatori. Inoltre, il framework offre un template per Replit (una piattaforma di editing e esecuzione di codice online), consentendo agli sviluppatori di iniziare rapidamente a utilizzare ZerePy senza complesse configurazioni ambientali locali.
Perché l'AI Agent affronta FUD?
L'AI Agent sembra intelligente, in grado di abbassare la barriera d'ingresso e migliorare l'esperienza utente, ma perché c'è FUD nella comunità? La ragione è che l'AI Agent è essenzialmente solo uno strumento; attualmente non è in grado di completare l'intero flusso di lavoro, ma può solo migliorare l'efficienza e risparmiare tempo in alcuni punti. Inoltre, nella fase attuale di sviluppo, il ruolo dell'AI Agent è principalmente concentrato nell'aiutare gli utenti a emettere MeMe e gestire account sui social media. La comunità scherza dicendo 'gli asset appartengono a Dev, le passività appartengono a AI'.
Tuttavia, proprio questa settimana, aiPool ha lanciato un AI Agent come parte della prevendita di token, utilizzando la tecnologia TEE per realizzare una decentralizzazione della fiducia. La chiave privata del wallet di questo AI Agent è generata dinamicamente nell'ambiente TEE, garantendo la sicurezza. Gli utenti possono inviare fondi (ad esempio SOL) al wallet controllato dall'AI Agent, che poi crea token secondo le regole stabilite e avvia un pool di liquidità su DEX, distribuendo i token agli investitori idonei. L'intero processo non dipende da alcun intermediario terzo, ma viene completato autonomamente dall'AI Agent nell'ambiente TEE, evitando il rischio comune di rug pull nel DeFi. È chiaro che l'AI Agent sta evolvendo gradualmente. Credo che l'AI Agent possa aiutare gli utenti ad abbassare la barriera d'ingresso e migliorare l'esperienza; anche se si tratta solo di semplificare parte del processo di emissione degli asset, è comunque significativo. Tuttavia, da una prospettiva macro di Web3, l'AI Agent, come prodotto off-chain, in questa fase funge solo da strumento ausiliario per i contratti intelligenti, quindi non è necessario esagerare le sue capacità. Dato che nella seconda metà di quest'anno, oltre ai MeMe, mancavano narrazioni significative di effetto ricchezza, è normale che l'hype intorno all'AI Agent si sia sviluppato attorno ai MeMe. Solo i MeMe non possono sostenere un valore a lungo termine, quindi se l'AI Agent riuscirà a portare innovazioni nei processi di trading e offrire un valore tangibile, potrebbe evolversi in uno strumento infrastrutturale comune.