Articolo ripubblicato da: ChainFeeds
Autore: 0XNATALIE
Dalla seconda metà dell'anno, l'interesse per il tema degli AI Agent è aumentato costantemente. Inizialmente, il chatbot AI terminal of truths ha attirato molta attenzione per i suoi post e risposte umoristiche su X (simile a 'Robert' su Weibo) e ha ricevuto un finanziamento di 50.000 dollari dal fondatore di a16z, Marc Andreessen. Ispirati dai suoi contenuti pubblicati, alcune persone hanno creato il token GOAT, che ha visto un aumento di oltre il 10.000% in sole 24 ore. Il tema degli AI Agent ha subito attirato l'attenzione della comunità Web3. Successivamente, è nato il primo fondo di trading AI decentralizzato basato su Solana, ai16z, che ha lanciato il framework di sviluppo AI Agent Eliza, scatenando una disputa sui token maiuscoli e minuscoli. Tuttavia, il concetto di AI Agent rimane poco chiaro nella comunità: qual è il nucleo dell'AI Agent? In cosa differisce dai bot di trading di Telegram?
Funzionamento: percezione, ragionamento e decisione autonoma
L'AI Agent è un sistema di agenti intelligenti basato su modelli linguistici di grandi dimensioni (LLM), in grado di percepire l'ambiente, prendere decisioni razionali e completare compiti complessi attraverso l'uso di strumenti o l'esecuzione di operazioni. Flusso di lavoro: modulo di percezione (acquisizione input) → LLM (comprensione, ragionamento e pianificazione) → chiamata agli strumenti (esecuzione dei compiti) → feedback e ottimizzazione (verifica e aggiustamento).
In particolare, l'AI Agent prima acquisisce dati dall'ambiente esterno attraverso un modulo di percezione (come testo, audio, immagini, ecc.) e li trasforma in informazioni strutturate che possono essere elaborate. L'LLM come componente centrale fornisce potenti capacità di comprensione e generazione del linguaggio naturale, fungendo da 'cervello' del sistema. Basandosi sui dati in ingresso e sulla conoscenza preesistente, l'LLM effettua ragionamenti logici, genera possibili soluzioni o formula piani d'azione. Successivamente, l'AI Agent completa compiti specifici chiamando strumenti esterni, plugin o API, e verifica e aggiusta i risultati in base ai feedback, formando un'ottimizzazione a ciclo chiuso.
In che modo l'AI Agent si differenzia dai bot di trading di Telegram o dagli script automatizzati nel contesto delle applicazioni Web3? Prendiamo ad esempio l'arbitraggio: l'utente desidera effettuare operazioni di arbitraggio a condizione che il profitto sia maggiore dell'1%. Nei bot di trading di Telegram che supportano l'arbitraggio, l'utente imposta la strategia di trading per un profitto maggiore dell'1%, e il bot inizia a eseguire. Tuttavia, quando il mercato è soggetto a fluttuazioni frequenti e le opportunità di arbitraggio cambiano continuamente, questi bot mancano di capacità di valutazione del rischio; eseguono arbitraggio non appena soddisfano la condizione di profitto maggiore dell'1%. Al contrario, l'AI Agent può regolare automaticamente la strategia. Ad esempio, quando il profitto di una transazione supera l'1%, ma attraverso l'analisi dei dati valuta che il rischio è troppo elevato, il mercato potrebbe cambiare improvvisamente causando perdite, deciderà di non eseguire quell'arbitraggio.
Pertanto, l'AI Agent possiede un'autoadattabilità, il suo vantaggio principale risiede nella capacità di apprendere autonomamente e prendere decisioni autonome, interagendo con l'ambiente (come mercato, comportamenti degli utenti, ecc.) e aggiustando le strategie comportamentali in base ai segnali di feedback, migliorando continuamente l'efficacia nell'esecuzione dei compiti. Può anche prendere decisioni in tempo reale basate su dati esterni e ottimizzare continuamente le strategie decisionali attraverso l'apprendimento rinforzato.
Detto così, sembra un po' come il risolutore (solver) all'interno di un framework di intenti? L'AI Agent stesso è anche un prodotto basato sugli intenti, la principale differenza con il risolutore all'interno di un framework di intenti è che il risolutore si basa su algoritmi precisi, con rigore matematico, mentre le decisioni dell'AI Agent dipendono dall'addestramento dei dati, spesso richiedendo un processo di tentativi ed errori per avvicinarsi alla soluzione ottimale.
Framework principali degli AI Agent
Il framework AI Agent è un'infrastruttura utilizzata per creare e gestire agenti intelligenti. Attualmente, nel Web3, i framework più popolari includono Eliza di ai16z, ZerePy di zerebro e GAME di Virtuals.
Eliza è un framework AI Agent multifunzionale, costruito in TypeScript, che supporta l'esecuzione su più piattaforme (come Discord, Twitter, Telegram, ecc.) e, attraverso una gestione complessa della memoria, è in grado di ricordare conversazioni e contesti precedenti, mantenendo caratteristiche di personalità e risposte di conoscenza stabili e coerenti. Eliza utilizza un sistema RAG (Retrieval Augmented Generation), che consente di accedere a database o risorse esterne per generare risposte più accurate. Inoltre, Eliza integra un plugin TEE, che consente il deployment all'interno del TEE, garantendo così la sicurezza e la privacy dei dati.
GAME è un framework che abilita e guida l'AI Agent a prendere decisioni e agire in modo autonomo. Gli sviluppatori possono personalizzare il comportamento dell'agente in base alle proprie esigenze, espandere le sue funzionalità e fornire operazioni personalizzate (come pubblicazione e risposta sui social media). Le diverse funzionalità nel framework, come la posizione ambientale dell'agente e i compiti, sono suddivise in più moduli per facilitare la configurazione e la gestione da parte degli sviluppatori. Il framework GAME divide il processo decisionale dell'AI Agent in due livelli: pianificazione di alto livello (HLP) e pianificazione di basso livello (LLP), responsabili rispettivamente di compiti e decisioni a diversi livelli. La pianificazione di alto livello si occupa di stabilire obiettivi generali e pianificazione dei compiti dell'agente, formulando decisioni in base a obiettivi, personalità, informazioni di contesto e stato ambientale, determinando la priorità dei compiti. La pianificazione di basso livello si concentra invece sull'esecuzione, traducendo le decisioni della pianificazione di alto livello in passaggi operativi concreti, selezionando funzionalità e metodi operativi appropriati.
ZerePy è un framework open-source in Python, progettato per il deployment di AI Agent su X. Questo framework integra LLM forniti da OpenAI e Anthropic, consentendo agli sviluppatori di costruire e gestire agenti sui social media, automatizzando operazioni come la pubblicazione di tweet, la risposta ai tweet, i 'like', ecc. Ogni compito può essere impostato con pesi diversi in base alla sua importanza. ZerePy offre un'interfaccia a riga di comando (CLI) semplice, facilitando agli sviluppatori l'avvio e la gestione rapida degli agenti. Inoltre, il framework fornisce modelli Replit (una piattaforma online per l'editing e l'esecuzione del codice), consentendo agli sviluppatori di iniziare rapidamente ad utilizzare ZerePy senza la necessità di configurazioni locali complesse.
Perché gli AI Agent affrontano FUD?
L'AI Agent sembra intelligente, capace di abbassare le barriere d'ingresso e migliorare l'esperienza utente, perché la comunità ha FUD? La ragione è che l'AI Agent è essenzialmente ancora solo uno strumento, attualmente non può completare l'intero flusso di lavoro, può solo migliorare l'efficienza e risparmiare tempo in alcuni punti. Inoltre, nella fase attuale di sviluppo, il ruolo dell'AI Agent è focalizzato principalmente sull'aiutare gli utenti a emettere MeMe con un clic e gestire account sui social media. La comunità scherza dicendo 'assests belong Dev, liabilities belong AI'.
Tuttavia, proprio questa settimana, aiPool ha lanciato l'AI Agent come pre-vendita di token, realizzando la disintermediazione tramite tecnologia TEE. La chiave privata del portafoglio di questo AI Agent viene generata dinamicamente nell'ambiente TEE, garantendo sicurezza. Gli utenti possono inviare fondi al portafoglio controllato dall'AI Agent (ad esempio SOL), e l'AI Agent poi crea token in base a regole stabilite e avvia un pool di liquidità su DEX, distribuendo contemporaneamente token agli investitori idonei. L'intero processo non richiede la dipendenza da alcun intermediario terzo, è completamente completato dall'AI Agent nell'ambiente TEE, evitando il rischio comune di rug pull nel DeFi. È evidente che l'AI Agent si sta sviluppando gradualmente. Credo che l'AI Agent possa aiutare gli utenti a ridurre le barriere d'ingresso e migliorare l'esperienza; anche se semplifica solo una parte del processo di emissione degli asset, è comunque significativo. Tuttavia, da una prospettiva macro del Web3, l'AI Agent, essendo un prodotto off-chain, nella fase attuale svolge solo un ruolo di strumento ausiliario per i contratti intelligenti, quindi non c'è bisogno di esagerare le sue capacità. Poiché nella seconda metà dell'anno, a parte MeMe, manca una narrazione di effetto ricchezza significativa, l'hype dell'AI Agent si è sviluppato attorno a MeMe, il che è normale. Sole MeMe non può mantenere un valore a lungo termine, quindi se l'AI Agent può portare più innovazioni nel processo di trading e offrire valore pratico, potrebbe svilupparsi in uno strumento infra comune.