Autore: jolestar
La scorsa settimana ho esplorato un po' gli AI Agent, l'altro giorno ho partecipato a un evento di ai16z a Pechino, per vedere cosa possono effettivamente fare gli AI Agent ora e riflettere su cosa possano fare in futuro.
Lo stato attuale degli AI Agent mi ricorda un meme, in cui una persona si nasconde dentro un distributore automatico. Le persone hanno già immaginato che gli AI Agent possano avere coscienza di sé, ma in realtà, dentro ogni AI Agent c'è un sviluppatore. (Qui ognuno può immaginare la scena, ho provato a far generare questa immagine all'AI, ma ho scoperto che l'AI non può comprendere "nascondere")
Il modo fondamentale di funzionamento del framework AI Agent
Il framework AI Agent attualmente funge da collante, unendo client (Twitter, Discord, Telegram, ecc.) e vari plugin (diverse blockchain, ecc.), e il framework fornisce una libreria di base (memoria, isolamento delle sessioni, generazione di contesto), per poi connettersi a vari interfaccie di piattaforme AI.
Come si integra il framework AI Agent con applicazioni e scenari aziendali
Da quando l'AI è esplosa l'anno scorso, sono emerse varie piattaforme e strumenti. La chiave è risolvere un problema: come si integra l'AI con le applicazioni. Alcune piattaforme AI tentano di fornire plugin, altre sviluppano modelli di flusso di lavoro, e ci sono applicazioni tradizionali che integrano AI al loro interno. Ma le chiavi sono: 1. Dove si trova l'ingresso per l'interazione dell'applicazione? 2. Come si integra l'AI con la logica aziendale esistente.
Le interfacce di interazione delle applicazioni fornite da varie piattaforme AI agli utenti sono tutte simili a una finestra di chat, e chiaramente tutti pensano che il modo di interagire con le applicazioni AI dovrebbe essere in un modo "umanizzato". In questo, la genialità degli AI Agent è che si connettono direttamente a tutti i sistemi IM e sociali aperti, il che è chiaramente più facilmente accettabile rispetto a crearne uno nuovo.
Come si integra l'AI con la logica aziendale esistente. La soluzione fornita dagli AI Agent è consentire agli sviluppatori di integrare le decisioni dell'AI nei contesti aziendali. I linguaggi di programmazione richiedono certezza; le condizioni degli if possono essere solo true o false, non possono gestire logiche aziendali vaghe. Tuttavia, attraverso l'AI, è possibile convertire logiche complesse in condizioni precise, per poi integrarle senza problemi nei contesti aziendali.
Ad esempio, la funzione di risposta ai messaggi nel gruppo; il tradizionale IM Bot deve essere attivato tramite alcuni comandi di messaggio chiari, mentre con l'AI è possibile implementare un metodo shouldReplyMessage, fornendogli il contesto, restituisce true o false.
Il ruolo dell'AI nei contesti logici aziendali è principalmente:
1. Scoperta delle "intenzioni": attraverso le indicazioni nei prompt, consentire all'AI di scoprire le "intenzioni" nei messaggi di testo degli utenti in base al contesto e mappare le intenzioni a codice specifico.
2. Supporto decisionale: utilizzare l'AI per convertire condizioni complesse e vaghe in veri/falsi definiti o in tipi enumerati, per poi integrarli nella logica aziendale.
A questo punto, molte persone potrebbero essere deluse dagli AI Agent; molti pensano che un AI Agent sia solo un AI che impari a fare tutto. In realtà, a causa delle limitazioni contestuali dei grandi modelli, non è possibile (almeno ora) costruire un AI universale in grado di fare qualsiasi cosa. Ma la buona notizia è che i programmatori non devono preoccuparsi di perdere il lavoro; dietro gli AI ci sarà sempre bisogno di molti programmatori, e c'è bisogno di qualcuno per gestire if e else, ma la differenza chiave è che i confini delle attività che i programmi possono gestire si stanno espandendo.
Due tipi di AI Agent
Durante un evento, ho posto una domanda a Shaw: il mercato ha due aspettative sugli AI Agent: 1. Gli AI Agent stessi assumono un ruolo, hanno una propria ID, un marchio e forniscono servizi agli utenti. 2. Gli utenti hanno un AI Agent personale, equivalente a un assistente personale, che può assistere gli utenti nella gestione di alcune attività. Quale delle due tipologie di AI Agent sarà più popolare? Ha detto che entrambe le direzioni potrebbero funzionare bene e potrebbero anche combinarsi.
Attualmente, il mercato esplora principalmente la prima direzione. Questa direzione è simile alla servitizzazione degli AI Agent, in futuro potrebbero non esserci più interfacce App, poiché tutte le App saranno diventate AI Agent, personificate. La seconda direzione è l'agenteizzazione dei client delle applicazioni; i futuri client delle applicazioni saranno un plugin per l'agente assistente, i dati locali dell'applicazione diventeranno parte della memoria dell'agente, mentre questo plugin sarà anche responsabile della comunicazione con l'agente di servizio nel cloud. Questa è una nuova modalità architetturale che cambierà l'intera infrastruttura.
Requisiti degli AI Agent per le infrastrutture
1. Le infrastrutture devono realizzare un accesso senza barriere (Permissionless), altrimenti gli AI Agent saranno limitati da varie strategie di difesa contro attacchi, i servizi dovrebbero essere protetti in modo economico (Gas). Su questo punto, le piattaforme con un'apertura relativamente scarsa affronteranno un impatto significativo; l'entusiasmo per le piattaforme aperte dei primi anni di Web2 sarà riacceso.
2. Gli AI Agent devono poter gestire fondi per pagare, per risolvere i problemi sopra menzionati.
Ciò significa che i servizi futuri, siano o meno basati su blockchain, dovranno supportare l'autenticazione dell'identità basata su modalità di chiavi private Crypto e pagamenti basati su Crypto.
Integrazione tra AI Agent e blockchain
Oltre ai due punti menzionati sopra, come si integra l'AI con la blockchain è una direzione che tutti stanno esplorando. Durante l'evento, ho parlato con Mikke riguardo a ciò che sta facendo con focEliza. Le due tipologie di AI Agent menzionate prima, almeno la prima, richiedono un ambiente di esecuzione o verifica fornito dalla blockchain. Infatti, una volta che un AI Agent offre servizi esterni, si pone un problema di fiducia; il ruolo che svolge è simile a quello di un contratto intelligente.
C'era una controversia sul nome "contratto intelligente"; è solo una riga di codice, dove è la sua "intelligenza"? L'AI può rendere i contratti intelligenti davvero intelligenti. La sfida è come chiamare le interfacce AI nell'ambiente del contratto intelligente. Se far funzionare un grande modello in un ambiente verificabile è ancora lontano, un approccio simile a Oracle è una strada più praticabile.
E attorno agli AI Agent emergeranno molte esigenze: come ottenere la conoscenza comune degli AI Agent? Come possono gli AI Agent determinare i fatti? Come possono gli AI Agent identificare lo stesso utente su diverse piattaforme? Come può essere memorizzata la "memoria" in un contratto intelligente? Se ho più dispositivi, ognuno con un AI Agent, come possono condividere la memoria?
Scoprirai che ciò che è stato fatto in Web3 come "data on-chain", relazioni on-chain, DID, reti P2P, ecc., avrà nuovi significati e scenari.
Conclusione
Riprendendo una conclusione del mio intervento del 2021 su AI e blockchain, un internet più amichevole verso l'AI è anche un internet più amichevole verso l'umanità. All'epoca era solo un'idea, ma ora il futuro è già qui.