Autore: jolestar

La scorsa settimana ho esaminato un po' l'AI Agent e ante ieri ho partecipato a un evento ai16z a Pechino, per vedere cosa può effettivamente fare l'AI Agent ora e riflettere su cosa potrà fare in futuro.

Lo stato attuale degli AI Agent mi ricorda quel meme, dove c'è una persona nascosta in un distributore automatico. L'AI Agent che tutti immaginano ha già iniziato ad avere una coscienza autonoma, ma in realtà, dentro l'AI Agent c'è un sviluppatore. (Qui tutti possono immaginare la scena; ho provato a far generare questa immagine all'AI, scoprendo che non riesce a capire 'nascosto')

Il modo di funzionamento di base del framework AI Agent

Il framework AI Agent funge attualmente da collante, unendo client (Twitter, Discord, Telegram, ecc.) e vari plugin (diverse blockchain, ecc.), e il framework fornisce una libreria di base (memoria, isolamento delle conversazioni, generazione di contesti), per poi connettersi a varie interfacce di piattaforme AI.

Come si integra il framework AI Agent con le applicazioni e gli scenari aziendali

Dallo scorso anno, con il boom dell'AI, sono emerse varie piattaforme e strumenti; la cosa più cruciale è risolvere un problema: come può l'AI integrarsi nelle applicazioni. Alcune piattaforme AI cercano di offrire plugin, alcune sviluppano modelli di flusso di lavoro, mentre alcune applicazioni tradizionali integrano l'AI all'interno. Ma la chiave qui è: 1. Dove si trova il punto di interazione dell'app? 2. Come può l'AI integrarsi nella logica aziendale esistente.

I punti di interazione delle applicazioni fornite dalle varie piattaforme AI agli utenti sono tutte simili a finestre di chat, e chiaramente si ritiene che il modo di interazione con le applicazioni AI dovrebbe essere 'antropomorfo'. L'intelligenza dell'AI Agent risiede nel fatto che si connette direttamente a tutti i sistemi IM aperti e alle reti sociali, il che è chiaramente più accettabile che crearne uno nuovo.

Come può l'AI integrarsi nella logica aziendale esistente. La soluzione offerta dagli AI Agent è permettere agli sviluppatori di integrare le decisioni dell'AI negli scenari aziendali. I linguaggi di programmazione richiedono certezza; le condizioni if possono essere solo true o false, non possono gestire logiche aziendali ambigue. Ma attraverso l'AI, è possibile convertire logiche complesse in condizioni precise, che possono poi essere integrate senza soluzione di continuità negli scenari aziendali.

Per esempio, la funzione di risposta ai messaggi nel gruppo, il tradizionale IM Bot deve essere attivato tramite alcuni comandi di messaggio espliciti, mentre attraverso l'AI può essere realizzato un metodo shouldReplyMessage, fornendogli un contesto, esso restituisce true o false.

Il ruolo dell'AI negli scenari di logica aziendale è principalmente:

1. Scoperta delle 'intenzioni': attraverso le indicazioni nelle parole chiave, consentire all'AI di scoprire le 'intenzioni' nei messaggi di testo degli utenti in base al contesto, mappando le intenzioni a codici specifici.

2. Assistenza nelle decisioni: attraverso l'AI, le condizioni complesse e ambigue vengono convertite in true/false determinati o tipi enumerati, per poi essere integrate nella logica aziendale.

Arrivati a questo punto, molte persone potrebbero essere deluse dagli AI Agent; molti pensano che un AI Agent sia semplicemente un AI che può fare tutto se gli si insegna qualcosa. In realtà, a causa dei limiti di contesto dei grandi modelli, non è possibile (almeno attualmente) creare un AI onnipotente che possa fare qualsiasi cosa. Ma la buona notizia è che i programmatori non devono preoccuparsi di perdere il lavoro; l'AI avrà comunque bisogno di una grande quantità di programmatori nascosti, ci sarà sempre bisogno di qualcuno che gestisca if e else, ma la differenza chiave è che i confini delle attività che i programmi possono gestire si stanno espandendo.

Due tipi di AI Agent

Durante l'evento, ho chiesto a Shaw una domanda: il mercato ha due aspettative per l'AI Agent: 1. L'AI Agent stesso svolge un ruolo, ha un proprio ID, un marchio, e fornisce servizi agli utenti. 2. Gli utenti hanno un AI Agent personale, equivalente a un assistente personale, che può aiutare gli utenti a gestire alcune faccende aziendali. Quale delle due tipologie di AI Agent sarà più popolare? Lui ritiene che entrambe le direzioni siano buone e potrebbero anche combinarsi.

Attualmente, il mercato esplora principalmente la prima direzione. Questa direzione è simile all'AI Agent come servizio; in futuro, potrebbe non esserci più un'interfaccia App, tutte le App saranno agenti AI, antropomorfizzati. La seconda direzione è l'agentificazione dell'app client, dove il client dell'app futura sarà un plugin dell'agente assistente, trasformando i dati locali dell'app in parte della memoria dell'agente, mentre questo plugin è anche responsabile della comunicazione con l'agente di servizio nel cloud. Questa è una nuova architettura applicativa che cambierà l'intera infrastruttura.

Requisiti degli AI Agent per l'infrastruttura

1. L'infrastruttura deve realizzare un accesso senza barriere (Permissionless), altrimenti gli AI Agent saranno limitati da varie strategie anti-attacco; il servizio dovrebbe utilizzare un costo economico (Gas) per difendersi dagli attacchi. Su questo punto, le piattaforme con un grado di apertura relativamente basso affronteranno grandi sfide; l'entusiasmo per le piattaforme aperte della Web2 iniziale sarà riacceso.

2. L'AI Agent deve essere in grado di gestire fondi per pagare, al fine di risolvere i problemi sopra citati.

In altre parole, i servizi futuri, siano essi basati su blockchain o meno, devono supportare l'autenticazione tramite chiave privata Crypto e pagamenti basati su Crypto.

La combinazione di AI Agent e blockchain

Oltre ai due punti sopra menzionati, come può l'AI Agent integrarsi con la blockchain è una direzione che stiamo esplorando. Durante l'evento, ho parlato con Mikke riguardo a focEliza che sta sviluppando. Le due tipologie di AI Agent menzionate in precedenza, almeno la prima, richiedono un ambiente di esecuzione o verifica fornito dalla blockchain. Perché, una volta che un AI Agent fornisce servizi esterni, ci saranno problemi di fiducia; il ruolo che svolge è in realtà simile a quello di un contratto intelligente.

C'era una controversia sul nome 'contratto intelligente'; è solo un pezzo di codice, dove sta la 'intelligenza'? L'AI può rendere i contratti intelligenti degni di tale nome. La sfida è come chiamare le interfacce AI in un ambiente di contratto intelligente. Se far funzionare grandi modelli in un ambiente verificabile è ancora una strada lontana, utilizzare una soluzione simile a Oracle è un percorso più praticabile.

Intorno agli AI Agent emergeranno molte esigenze: come ottenere la conoscenza pubblica degli AI Agent? Come può un AI Agent determinare i fatti? Come può un AI Agent riconoscere lo stesso utente su piattaforme diverse? Come vengono memorizzati i 'ricordi' nei contratti intelligenti? Se ho più dispositivi, ciascuno con un AI Agent, come possono condividere la memoria?

Scoprirai che ciò che è stato fatto in Web3 come 'data on-chain', relazioni on-chain, DID, reti P2P, ecc., ha nuovi significati e scenari.

Conclusione

Riutilizzando la mia conclusione di una presentazione del 2021 su AI e blockchain, un internet più amichevole verso l'AI è anche un internet più amichevole verso l'umanità. Allora era solo un'idea, ma ora il futuro è già arrivato.