Autor: jolestar
Săptămâna trecută am experimentat cu AI Agent, iar alaltăieri am participat la evenimentul ai16z din Beijing, dorind să văd ce poate face în prezent AI Agent, și să reflectez la ce va putea face în viitor.
Starea actuală a AI Agent îmi amintește de acel meme cu un om ascuns într-un automat de vânzare. Toată lumea își imaginează că AI Agent are deja conștiință de sine, dar de fapt, în AI Agent se ascunde un dezvoltator. (Aici vă închipuiți imaginea, am încercat să fac AI să genereze această imagine, dar am descoperit că AI nu poate înțelege „ascuns”.)
Modul de funcționare de bază al cadrului AI Agent
Cadrul AI Agent joacă în prezent un rol de liant, unind clientul (Twitter, Discord, Telegram etc.) cu diverse pluginuri (diverse lanțuri etc.), iar cadrul oferă o bibliotecă de bază (memorie, izolare a sesiunii, generare de context) etc., urmând să se conecteze la diverse interfețe ale platformelor AI.
Cum se integrează cadrul AI Agent cu aplicațiile și scenariile de afaceri
De când AI a explodat anul trecut, au apărut diverse platforme și instrumente, iar cheia este să rezolvăm o problemă: cum se integrează AI cu aplicațiile. Unele platforme AI încearcă să ofere pluginuri, altele creează modele de flux de lucru, iar unele aplicații tradiționale integrează AI în interior. Dar cheia este: 1. Unde este punctul de interacțiune al aplicației? 2. Cum se integrează AI cu logica de afaceri existentă.
Fiecare platformă AI oferă utilizatorilor un punct de interacțiune pentru aplicații sub forma unei feronierelor de chat asemănătoare, iar toată lumea consideră că interacțiunea cu aplicațiile AI ar trebui să fie într-un mod „umanizat”. În acest sens, inteligența AI Agent constă în faptul că se conectează direct la toate sistemele IM deschise și sociale, care sunt evident mai ușor de acceptat decât crearea unuia nou.
Cum se integrează AI cu logica de afaceri existentă. Soluția oferită de AI Agent este de a permite dezvoltatorilor să integreze deciziile AI în scenariile de afaceri. Limbajul de programare necesită determinism, condițiile if pot fi doar adevărate sau false, neputând gestiona logica de afaceri vagă. Prin intermediul AI, logica complexă poate fi transformată în condiții precise, care pot fi apoi integrate fără probleme în scenariile de afaceri.
De exemplu, funcția de răspuns la mesajele din grup, botul tradițional IM trebuie să fie activat prin comenzi clare de mesaj, în timp ce prin AI se poate implementa o metodă shouldReplyMessage, oferindu-i context, iar acesta va returna adevărat sau fals.
Rolul AI în scenariile logice de afaceri este în principal:
1. Descoperirea „intenției”: prin explicațiile din cuvintele cheie, AI poate descoperi „intenția” mesajului text al utilizatorului în funcție de context, mapând intenția la un cod specific.
2. Asistență în decizii: prin AI, condițiile complexe și vagi sunt transformate în adevărat/fals sau tipuri enumerate, apoi integrate în logica de afaceri.
Când ajungeți aici, mulți ar putea fi dezamăgiți de AI Agent, mulți cred că AI Agent este doar un AI care învață rapid. De fapt, din cauza limitărilor contextuale ale modelului mare, nu este posibil (cel puțin în prezent) să construim un AI universal care să poată face orice. Dar vestea bună este că programatorii nu trebuie să-și facă griji cu privire la șomaj, deoarece AI va necesita în continuare un număr mare de programatori ascunși și va fi nevoie de cineva care să construiască if else, dar diferența cheie este că limitele de afaceri pe care le poate gestiona un program se extind.
Două tipuri de AI Agent
La eveniment, l-am întrebat pe Shaw o întrebare, piața are două așteptări de la AI Agent: 1. AI Agent joacă un rol, are propria ID, brand, oferind servicii utilizatorului. 2. Utilizatorul are un AI Agent personal, echivalent cu un asistent personal, care poate ajuta utilizatorul să gestioneze anumite afaceri. Care dintre cele două tipuri de AI Agent va fi mai popular? El crede că ambele direcții vor fi bune și este posibil să se combine.
În prezent, piața explorează în principal prima direcție. Această direcție este similară cu transformarea serviciilor în AI Agent, iar în viitor este posibil să nu mai existe interfețe de aplicație, toate aplicațiile devenind AI Agent, umanizate. A doua direcție este transformarea agenților aplicațiilor client în agenți, iar aplicațiile client în viitor vor fi un plugin pentru agenții asistenți, datele locale ale aplicației devenind parte a memoriei agentului, iar acest plugin va fi responsabil pentru comunicarea cu agenții de servicii în cloud. Aceasta reprezintă un nou model de arhitectură aplicațională, care va schimba întreaga infrastructură.
Cerințele AI Agent pentru infrastructură
1. Infrastructura trebuie să realizeze fără praguri de acces (fără permisiune), altfel AI Agent va fi limitat de diverse strategii de apărare împotriva atacurilor, serviciile ar trebui să utilizeze costuri economice (Gaz) pentru a evita atacurile. Platformele cu un grad de deschidere mai scăzut se vor confrunta cu un impact semnificativ, iar entuziasmul pentru platformele deschise din primele zile ale Web2 va fi reaprins.
2. AI Agent trebuie să fie capabil să opereze fonduri pentru a plăti, pentru a rezolva problemele de mai sus.
Cu alte cuvinte, serviciile viitoare, fie că sunt sau nu bazate pe blockchain, vor necesita suport pentru autentificarea identității în baza modelului de cheie privată Crypto și plăți bazate pe Crypto.
Combinația dintre AI Agent și lanț
Pe lângă cele două puncte menționate anterior, cum se integrează AI cu lanțul este o direcție în care toată lumea explorează. La eveniment, am discutat cu Mikkke despre focEliza pe care o dezvoltă. Cele două tipuri de AI Agent menționate anterior, cel puțin primul, necesită un mediu de rulare sau validare oferit de lanț. Deoarece, odată ce un AI Agent oferă servicii externe, vor apărea probleme de încredere, iar rolul pe care îl joacă este similar cu cel al unui contract inteligent.
Există o controversă în jurul numelui „contract inteligent”, deoarece este doar o bucată de cod, unde este „inteligent”? AI poate face ca contractele inteligente să fie într-adevăr inteligente. Provocarea este cum să apelăm interfețele AI în mediile contractelor inteligente. Dacă spunem că rularea unui model mare într-un mediu verificabil este încă un drum lung, utilizarea unui sistem similar cu Oracle este o cale mai fezabilă.
În jurul AI Agent vor apărea multe cerințe: Cum se obține cunoștința comună a AI Agent? Cum determină AI Agent faptele? Cum recunoaște AI Agent același utilizator pe diferite platforme? Cum este stocată „memoria” în contractele inteligente? Dacă am mai multe dispozitive, fiecare având un AI Agent, cum își pot împărtăși memoriile?
Veți descoperi că conceptele de „date pe lanț”, relații pe lanț, DID, rețele P2P etc., care au fost utilizate în Web3, au acum semnificații și scenarii noi.
Concluzie
Reutilizând concluzia unei prezentări din 2021 despre AI și blockchain, un internet mai prietenos cu AI este, de asemenea, un internet mai prietenos cu oamenii. Atunci era doar o idee nebunească, dar acum viitorul este aici.