Fonte dell'articolo: PA Raccomandato
Autore: jolestar
La settimana scorsa ho lavorato un po' sugli agenti AI, ante ieri ho partecipato a un evento ai16z a Pechino, volevo vedere cosa possono fare attualmente gli agenti AI e riflettere su cosa potrebbero fare in futuro.
La situazione attuale degli agenti AI mi ricorda quel meme, in cui una persona è nascosta dentro un distributore automatico. Tutti immaginano che l'agente AI abbia già acquisito coscienza autonoma, ma in realtà dentro l'agente AI c'è un sviluppatore. (Qui tutti possono immaginare l'immagine, ho provato a far generare questa immagine all'AI, ma ho scoperto che l'AI non riesce a capire 'nascosto')
Il modo di funzionare di base del framework degli agenti AI
L'attuale framework degli agenti AI funge da collante, unendo client (Twitter, Discord, Telegram, ecc.) e vari plugin (diverse blockchain, ecc.), e poi il framework fornisce una libreria di base (memoria, isolamento delle conversazioni, generazione di contesto, ecc.), per successivamente interfacciarsi con varie piattaforme AI.
Come si integra il framework degli agenti AI con le applicazioni e gli scenari aziendali
Da quando l'AI è esplosa l'anno scorso, sono emerse varie piattaforme e strumenti, la cosa più importante è risolvere un problema: come si integra l'AI con le applicazioni. Alcune piattaforme AI stanno tentando di fornire plugin, alcune creano modelli di flusso di lavoro, e ci sono anche applicazioni tradizionali che integrano l'AI al loro interno. Ma le questioni chiave sono: 1. Dove si trova l'interfaccia di interazione dell'applicazione? 2. Come si integra l'AI con la logica aziendale esistente.
Tutte le piattaforme AI forniscono agli utenti un'interfaccia di interazione simile a una finestra di chat, e ovviamente tutti pensano che il modo di interagire con le applicazioni AI debba essere 'umanizzato'. E in questo, la genialità dell'agente AI sta nel fatto che si connette direttamente a tutti i sistemi IM aperti e social, chiaramente più accettabile rispetto a crearne uno nuovo.
Come si integra l'AI con la logica aziendale esistente. La soluzione fornita dagli agenti AI è consentire agli sviluppatori di integrare le decisioni dell'AI negli scenari aziendali. I linguaggi di programmazione richiedono determinismo, le condizioni if possono essere solo true o false, non possono gestire logiche aziendali sfumate. Ma attraverso l'AI è possibile convertire logiche complesse in condizioni precise, che possono quindi essere integrate senza soluzione di continuità negli scenari aziendali.
Ad esempio, la funzione di risposta ai messaggi all'interno di un gruppo, i bot IM tradizionali devono essere attivati da comandi di messaggio specifici, mentre con l'AI si può realizzare un metodo shouldReplyMessage, fornendogli il contesto, restituirà true o false.
Il ruolo dell'AI negli scenari di logica aziendale è principalmente:
1. Scoperta delle “intenzioni”: attraverso le spiegazioni nei suggerimenti, consentire all'AI di scoprire le “intenzioni” nei messaggi di testo degli utenti in base al contesto, mappando le intenzioni a codice specifico.
2. Assistenza nelle decisioni: tramite l'AI, le condizioni complesse e sfumate vengono convertite in condizioni certe true/false o tipi enumerati, per poi essere integrate nella logica aziendale.
Arrivato a questo punto, molte persone potrebbero essere deluse dagli agenti AI, molti pensano che un agente AI sia sufficiente insegnargli qualcosa e lui saprà fare di tutto. In realtà, a causa dei limiti di contesto dei grandi modelli, non è possibile (almeno attualmente) creare un AI universale in grado di fare qualsiasi cosa. Ma la buona notizia è che i programmatori non devono preoccuparsi di perdere il lavoro, l'AI avrà sempre bisogno di un vasto numero di programmatori dietro, e ci sarà bisogno di qualcuno per gestire if e else, ma la differenza chiave è che i confini delle operazioni che il programma può gestire si stanno espandendo.
Due tipi di agenti AI
Durante l'evento, ho posto una domanda a shaw riguardo le aspettative del mercato sugli agenti AI, 1. L'agente AI stesso gioca un ruolo, ha una propria ID, un marchio, e fornisce servizi agli utenti. 2. Gli utenti hanno un agente AI personale, equivalente a un assistente personale, in grado di aiutare gli utenti a gestire alcune attività. Quale di questi due agenti AI sarà più popolare? Pensa che entrambe le direzioni siano buone e potrebbero anche combinarsi.
Attualmente, sul mercato, le persone stanno esplorando principalmente la prima direzione. Questa direzione è simile alla servitizzazione degli agenti AI, in futuro potrebbe non esserci più un'interfaccia app, tutte le app saranno agenti AI, umanizzate. La seconda direzione è l'agente dell'app client, in futuro il client dell'app sarà un plugin dell'agente assistente, i dati locali dell'app diventeranno parte della memoria dell'agente, mentre questo plugin sarà anche responsabile della comunicazione con gli agenti di servizio nel cloud. E questo rappresenta un nuovo modello architettonico per le applicazioni, che cambierà l'intera infrastruttura.
Requisiti degli agenti AI per l'infrastruttura
1. Le infrastrutture devono realizzare un'accessibilità senza barriere (Permissionless), altrimenti gli agenti AI saranno limitati da varie strategie anti-attacco, il servizio dovrebbe utilizzare un costo economico (Gas) per proteggersi dagli attacchi. In questo, le piattaforme con un basso grado di apertura subiranno un grande impatto, l'entusiasmo per le piattaforme aperte dei primi giorni del Web2 verrà riacceso.
2. Gli agenti AI devono essere in grado di maneggiare fondi per effettuare pagamenti, per risolvere i problemi sopra menzionati.
In altre parole, i servizi futuri, siano essi basati su blockchain o meno, devono supportare l'autenticazione dell'identità tramite chiavi private Crypto e pagamenti basati su Crypto.
Integrazione tra agenti AI e blockchain
Oltre ai due punti sopra menzionati, come si integrano gli agenti AI con la blockchain è un'area che stiamo esplorando. Durante l'evento, ho parlato con Mikkke riguardo a focEliza che sta sviluppando. Le due tipologie di agenti AI menzionate prima, almeno la prima, richiedono un ambiente di esecuzione o verifica fornito dalla blockchain. Perché una volta che un agente AI offre servizi esterni, ci saranno problemi di fiducia, il suo ruolo è simile a quello di uno smart contract.
C'era una controversia sul nome 'smart contract', è solo una porzione di codice, dove sarebbe 'intelligente', l'AI può rendere gli smart contract realmente intelligenti. La sfida è come chiamare le interfacce AI nell'ambiente degli smart contract. Se dire che far funzionare un grande modello in un ambiente verificabile è ancora lontano, utilizzare soluzioni simili a Oracle è un percorso più pratico.
E attorno agli agenti AI si genereranno molte esigenze, come ottenere la conoscenza pubblica degli agenti AI? Come possono gli agenti AI determinare i fatti? Come possono gli agenti AI identificare lo stesso utente su diverse piattaforme? Come viene memorizzata la 'memoria' negli smart contract? Se ho più dispositivi ciascuno con un agente AI, come possono condividere la memoria?
Scoprirai che le cose come 'data on chain', 'relations on chain', DID, P2P network, ecc., tutte hanno nuovi significati e scenari nel Web3.
Conclusione
Riutilizzando la mia conclusione da una condivisione su AI e blockchain nel 2021, un internet più amichevole per l'AI è anche un internet più amichevole per l'umanità. All'epoca era solo un'idea, ma ora il futuro è arrivato.