Autor: jolestar

Săptămâna trecută, am experimentat un pic cu AI Agent și, alaltăieri, am participat la evenimentul ai16z din Beijing, dorind să văd ce poate face în prezent AI Agent și să reflectez asupra a ceea ce poate face în viitor.

Starea actuală a AI Agent îmi aduce aminte de acel meme, un vending machine care ascunde o persoană. Toată lumea își imaginează un AI Agent care a început să aibă conștiință de sine, dar de fapt, în AI Agent se ascunde un dezvoltator. (Aici, toată lumea poate imagina imaginea, am încercat să fac AI să genereze această imagine, dar am descoperit că AI nu poate înțelege 'ascuns')

Modul de bază în care funcționează cadrul AI Agent

Cadrul AI Agent joacă în prezent rolul de adeziv, unind clientul (Twitter, Discord, Telegram etc.) cu diverse pluginuri (diferite blockchain-uri etc.), iar cadrul oferă o bibliotecă de bază (stocare a memoriei, izolare a sesiunilor, generare de context) etc., pentru a se conecta ulterior la diferitele interfețe ale platformelor AI.

Cum se combină cadrul AI Agent cu aplicațiile și scenariile de afaceri

De la explozia AI de anul trecut, au apărut diverse platforme și instrumente, iar cel mai important este să rezolvăm o problemă: cum se combină AI cu aplicațiile. Unele platforme AI încearcă să ofere pluginuri, unele dezvoltă modele de flux de lucru, iar altele integrează AI în aplicații tradiționale. Dar cheia este: 1. Unde este portalul de interacțiune al aplicației? 2. Cum se combină AI cu logica de afaceri existentă?

Portalurile de interacțiune pe care diferitele platforme AI le oferă utilizatorilor sunt, evident, feronii de dialog asemănătoare cu feronii de chat, unde toată lumea consideră că interacțiunea cu aplicațiile AI ar trebui să fie o formă 'antropomorfă'. În această privință, inteligența AI Agent constă în faptul că se conectează direct la toate sistemele IM deschise și sociale, ceea ce este evident mai ușor de acceptat decât crearea unui nou sistem.

Cum se combină AI cu logica de afaceri existentă. Soluția oferită de AI Agent este să permită dezvoltatorilor să integreze deciziile AI în scenariile de afaceri. Limbajele de programare necesită determinism; condițiile if pot fi doar adevărat sau fals, nu pot gestiona logica de afaceri neclară. Cu ajutorul AI, logica complexă poate fi transformată în condiții precise, care pot fi apoi integrate fără probleme în scenariile de afaceri.

De exemplu, funcția de răspuns la mesaje în grup, un bot IM tradițional trebuie să fie activat prin anumite comenzi clare, în timp ce prin AI se poate realiza o metodă shouldReplyMessage, oferindu-i context, iar acesta va returna adevărat sau fals.

Rolul AI în scenariile de logică de afaceri este în principal:

1. Descoperirea 'intenției': prin explicațiile din cuvintele cheie, AI identifică 'intenția' mesajelor text ale utilizatorului în funcție de context, mapând intenția la coduri specifice.

2. Asistarea deciziilor: prin AI, condițiile complexe și neclare sunt transformate în tipuri de adevărat/fals sau enumerare, apoi integrate în logica de afaceri.

După ce am citit asta, mulți oameni ar putea fi dezamăgiți de AI Agent; mulți cred că un AI Agent este pur și simplu un AI care învață și poate face orice. În realitate, din cauza limitărilor contextuale ale modelului mare, nu putem (cel puțin în prezent) crea un AI universal care să poată face orice. Dar vestea bună este că programatorii nu trebuie să se îngrijoreze de șomaj, deoarece AI-ul va avea în continuare nevoie de o mulțime de programatori, iar cineva trebuie să construiască if else-uri, dar diferența esențială este că limitele de afaceri pe care le pot gestiona programele se extind.

Două tipuri de AI Agent

La eveniment, am pus o întrebare lui Shaw; piața are două așteptări de la AI Agent: 1. AI Agent joacă un rol, are propriul ID, brand, oferind servicii utilizatorilor. 2. Utilizatorul are un AI Agent personal, care funcționează ca un asistent personal, putând ajuta utilizatorul să gestioneze anumite afaceri. Care dintre cele două tipuri de AI Agent va fi mai popular? El consideră că ambele direcții vor fi bune și este posibil să se combine.

Acum, pe piață, majoritatea oamenilor explorează în continuare prima direcție. Această direcție este similară cu transformarea AI în Agent, în viitor este posibil să nu mai existe o interfață de aplicație, toate aplicațiile vor fi transformate în agenți AI, antropomorfizate. A doua direcție este transformarea agenților în clienți de aplicații; viitoarele clienți ai aplicațiilor vor fi un plugin de agent asistent, datele locale ale aplicației devenind parte a memoriei agentului, iar acest plugin va fi responsabil de comunicarea cu agenții de servicii din cloud. Aceasta este o nouă arhitectură de aplicație care va schimba întreaga infrastructură.

Cerințele AI Agent pentru infrastructură

1. Infrastructura trebuie să realizeze fără bariere de acces (Permissionless); altfel, AI Agent va fi restricționat de diverse strategii de atac, iar serviciile ar trebui să utilizeze costuri economice (Gas) pentru a preveni atacurile. În această privință, platformele cu un grad mai scăzut de deschidere vor face față unor șocuri mari, iar entuziasmul pentru platformele deschise din primele zile ale Web2 va fi reaprins.

AI Agent trebuie să fie capabil să opereze fonduri pentru a plăti, pentru a rezolva problema de mai sus.

Cu alte cuvinte, serviciile viitoare, fie că sunt bazate sau nu pe blockchain, trebuie să suporte autentificarea identității bazată pe cheile private Crypto și plățile bazate pe Crypto.

Combinația AI Agent și blockchain

În afară de cele două puncte menționate mai sus, modul în care AI Agent se combină cu blockchain este o direcție pe care toată lumea o explorează. La eveniment, am discutat cu Mikkke despre focEliza. Cele două tipuri de AI Agent menționate anterior, cel puțin primul, necesită un mediu de rulare sau de validare oferit de blockchain. Deoarece, odată ce un AI Agent oferă servicii externe, va exista o problemă de încredere; rolul său este practic același cu cel al unui contract inteligent.

Există o controversă legată de numele 'contract inteligent'; este doar un cod, unde este 'inteligența'. AI poate face ca contractul inteligent să fie cu adevărat inteligent. Provocarea este cum să apelăm la interfețele AI în medii de contract inteligent. Dacă spunem că rularea unui model mare într-un mediu verificabil este încă o distanță, utilizarea unor soluții precum Oracle este o cale mai practică.

În jurul AI Agent se vor dezvolta o mulțime de cerințe; cum se obține cunoștințele comune ale AI Agent? Cum poate AI Agent să determine faptele? Cum poate AI Agent să recunoască același utilizator pe diferite platforme? Cum se stochează 'memoria' în contractele inteligente? Dacă am mai multe dispozitive, fiecare având un AI Agent, cum își împărtășesc memoria?

Veți descoperi că conceptele de 'date pe blockchain', relații pe blockchain, DID, rețele P2P etc., pe care le-am explorat în Web3, au noi semnificații și scenarii.

Concluzie

Reutilizând concluzia pe care am folosit-o în 2021 pentru a discuta despre AI și blockchain, un internet mai prietenos pentru AI este, de asemenea, un internet mai prietenos pentru umanitate. Atunci era doar o idee, dar acum viitorul a sosit.