Autore: jolestar
La settimana scorsa ho sperimentato un po' con l'AI Agent; l'altro giorno ho partecipato a un evento di ai16z a Pechino, per vedere cosa può effettivamente fare l'AI Agent ora e pensare a cosa potrà fare in futuro.
Lo stato attuale dell'AI Agent mi ricorda quel meme, in cui una persona si nasconde dentro un distributore automatico. Gli altri immaginano che l'AI Agent abbia già una coscienza autonoma, ma in realtà dentro l'AI Agent si nasconde uno sviluppatore. (Qui ognuno può immaginare la scena; ho provato a far generare un'immagine dall'AI, ma ho scoperto che non può comprendere 'nascosto')
Il modo fondamentale in cui funziona il framework dell'AI Agent
Il framework dell'AI Agent attualmente svolge una funzione di collante, unendo client (Twitter, Discord, Telegram, ecc.) e vari plugin (diverse blockchain, ecc.), e poi il framework offre una libreria di base (memoria, isolamento delle conversazioni, generazione di contesti) e così via, per poi collegarsi a vari interfacce di piattaforme AI.
Come si integra il framework dell'AI Agent con applicazioni e scenari aziendali
Dallo scorso anno, da quando l'AI è esplosa, sono emerse varie piattaforme e strumenti; la questione cruciale è come integrare l'AI con le applicazioni. Alcune piattaforme AI stanno tentando di offrire plugin, altre stanno creando modelli di flusso di lavoro, e ci sono anche applicazioni tradizionali che integrano l'AI all'interno delle loro applicazioni. Ma le domande chiave sono: 1. Dove si trova l'interfaccia di interazione dell'app? 2. Come si integra l'AI con la logica aziendale esistente.
Tutti le piattaforme AI offrono agli utenti un'interfaccia per le applicazioni simile a una finestra di chat; è evidente che tutti credono che l'interazione con le applicazioni AI dovrebbe avvenire in modo 'umanizzato'. In questo, l'AI Agent è intelligente perché si collega direttamente a tutti i sistemi IM aperti e sociali, il che è sicuramente più accettabile che crearne uno nuovo.
Come si integra l'AI con la logica aziendale esistente. La soluzione offerta dall'AI Agent è consentire agli sviluppatori di integrare le decisioni dell'AI negli scenari aziendali. I linguaggi di programmazione richiedono certezza; le condizioni if possono essere solo vero o falso, non possono gestire logiche aziendali sfocate. Ma attraverso l'AI, possiamo convertire logiche complesse in condizioni precise, per poi integrarle senza soluzione di continuità negli scenari aziendali.
Ad esempio, la funzione di risposta ai messaggi nel gruppo, i tradizionali bot IM devono essere attivati attraverso comandi di messaggio espliciti, mentre con l'AI possiamo implementare un metodo shouldReplyMessage, fornendogli il contesto, e restituirà vero o falso.
Il ruolo dell'AI nello scenario della logica aziendale è principalmente:
1. Scoperta dell' 'intento': attraverso le spiegazioni nei prompt, l'AI scopre l' 'intento' nei messaggi testuali dell'utente in base al contesto, mappando l'intento in codice specifico.
2. Assistenza decisionale: attraverso l'AI, le condizioni complesse e sfocate vengono convertite in valori definiti di vero/falso o in tipologie enumerate, per poi essere integrate nella logica aziendale.
Arrivati a questo punto, molte persone potrebbero rimanere deluse dagli AI Agent; molti pensano che basti insegnare qualcosa all'AI e farà tutto. In realtà, a causa dei limiti di contesto dei grandi modelli, non è possibile (almeno attualmente) creare un'AI universale che possa fare qualsiasi cosa. Ma la buona notizia è che i programmatori non devono preoccuparsi di perdere il lavoro; dietro l'AI rimangono molti programmatori, e ci sarà sempre bisogno di qualcuno per gestire if e else, ma la differenza chiave è che i confini degli affari gestibili dai programmi si stanno espandendo.
Due tipi di AI Agent
Durante l'evento, ho posto una domanda a Shaw: il mercato ha due aspettative per l'AI Agent, 1. L'AI Agent stesso interpreta un ruolo, ha una propria ID, un marchio e fornisce servizi agli utenti. 2. L'utente ha un AI Agent personale, equivalente a un assistente personale, che può aiutare l'utente a gestire alcune attività. Quale di queste due tipologie di AI Agent sarà più popolare? Pensa che entrambe le direzioni possano andare bene e potrebbero anche combinarsi.
Attualmente, sul mercato, le persone stanno principalmente esplorando la prima direzione. Questa direzione è simile alla trasformazione in AI Agent dei servizi; in futuro, potrebbe non esserci più un'interfaccia per le app; tutte le app saranno trasformate in AI Agent, umanizzate. La seconda direzione, invece, riguarda l'agenzia del client dell'app, dove il client dell'app sarà un plugin dell'AI Agent, i dati locali dell'app diventeranno parte della memoria dell'Agent, mentre questo plugin sarà anche responsabile della comunicazione con l'Agent di servizio nel cloud. Questa è una nuova architettura delle applicazioni che cambierà l'intera infrastruttura.
Requisiti dell'AI Agent per l'infrastruttura
1. L'infrastruttura deve realizzare un'accessibilità senza barriere (Permissionless), altrimenti l'AI Agent sarà limitato da varie strategie di protezione contro attacchi; i servizi dovrebbero utilizzare un modello di costo economico (Gas) per difendersi dagli attacchi. In questo senso, le piattaforme con un basso grado di apertura affronteranno grandi sfide, e l'entusiasmo per le piattaforme aperte dei primi anni di Web2 sarà riacceso.
2. L'AI Agent deve essere in grado di gestire fondi per effettuare pagamenti, al fine di risolvere il problema sopra menzionato.
In altre parole, i servizi futuri, indipendentemente dal fatto che siano o meno basati su blockchain, dovranno supportare l'autenticazione tramite chiavi private basate su Crypto e pagamenti basati su Crypto.
Integrazione tra AI Agent e blockchain
Oltre ai due punti menzionati sopra, come l'AI Agent si integra con la blockchain è una direzione che tutti stanno esplorando. Durante l'evento, ho parlato con Mikkke di focEliza che sta creando. Le due tipologie di AI Agent menzionate in precedenza, almeno la prima, necessitano di un ambiente di esecuzione o verifica fornito dalla blockchain. Perché una volta che un AI Agent offre servizi all'esterno, ci sono problemi di fiducia; il suo ruolo è in realtà simile a quello di un contratto intelligente.
C'era una controversia sul nome 'contratto intelligente', poiché è solo una porzione di codice; dov'è la 'intelligenza'? L'AI può rendere i contratti intelligenti tali. La sfida è come invocare interfacce AI in un ambiente di contratto intelligente. Se far funzionare grandi modelli in un ambiente verificabile è ancora una strada lontana, utilizzare soluzioni simili agli Oracle è un percorso più praticabile.
Intorno all'AI Agent sorgeranno molte esigenze; come può essere acquisita la conoscenza pubblica dell'AI Agent? Come può l'AI Agent determinare i fatti? Come può l'AI Agent identificare lo stesso utente su piattaforme diverse? Come viene memorizzata la 'memoria' nei contratti intelligenti? Se ho più dispositivi, ognuno con un AI Agent, come possono condividere la memoria?
Scoprirai che il 'data on-chain', le relazioni on-chain, DID, reti P2P, ecc., che erano stati sviluppati in Web3, hanno ora nuovi significati e scenari.
Conclusione
Riutilizzando la mia conclusione di una condivisione del 2021 su AI e blockchain, un internet più amichevole verso l'AI è anche un internet più amichevole verso l'umanità. All'epoca era solo un'idea, ma ora il futuro è già arrivato.