În a doua jumătate a acestui an, subiectul Agenților AI a continuat să câștige popularitate. La început, chatbotul AI terminal of truths a fost foarte apreciat pentru postările și răspunsurile sale umoristice pe X (similar cu „Robert” de pe Weibo) și a primit o finanțare de 50.000 de dolari din partea fondatorului a16z, Marc Andreessen. Inspirat de conținutul său, cineva a creat tokenul GOAT, care a crescut cu peste 10.000% în doar 24 de ore. Subiectul Agenților AI a stârnit imediat interesul comunității Web3. Ulterior, a fost lansat primul fond de investiții descentralizat AI bazat pe Solana, ai16z, care a introdus cadrul de dezvoltare a Agenților AI, Eliza, și a generat o competiție între tokenurile mari și mici. Cu toate acestea, comunitatea nu are încă o înțelegere clară a conceptului de Agent AI: Care este, de fapt, esența Agenților AI? Cu ce se deosebesc de roboții de tranzacționare Telegram?
Principiul de funcționare: percepție, raționare și decizie autonomă
Agentul AI este un sistem inteligent bazat pe modele lingvistice mari (LLM) care poate percepe mediul, ia decizii raționale și îndeplinește sarcini complexe prin apelarea uneltelor sau executarea de operațiuni. Flux de lucru: modul de percepție (obținerea inputului) → LLM (înțelegere, raționare și planificare) → apelul instrumentelor (executarea sarcinilor) → feedback și optimizare (verificare și ajustare).
În mod specific, Agentul AI obține mai întâi date din mediu prin modul de percepție (de exemplu, text, audio, imagini etc.) și le transformă în informații structurate care pot fi procesate. LLM, ca componentă centrală, oferă capacități puternice de înțelegere și generare a limbajului natural, acționând ca „creierul” sistemului. Pe baza datelor de intrare și a cunoștințelor existente, LLM efectuează raționamente logice, generând soluții posibile sau planuri de acțiune. Ulterior, Agentul AI finalizează sarcinile specifice prin apelarea uneltelor externe, pluginurilor sau API-urilor, și validează și ajustează rezultatele pe baza feedbackului, formând un ciclu de optimizare.
În scenariile de aplicare Web3, cu ce se deosebește Agentul AI de roboții de tranzacționare Telegram sau scripturile de automatizare? De exemplu, în cazul arbitrajului, utilizatorul dorește să efectueze tranzacții de arbitraj când profitul depășește 1%. În roboții de tranzacționare Telegram care susțin arbitrajul, utilizatorul stabilește o strategie de tranzacționare pentru profituri mai mari de 1%, iar Botul începe să execute. Totuși, când piața fluctuează frecvent și oportunitățile de arbitraj se schimbă constant, acești Boturi nu au capacitatea de evaluare a riscurilor, executând arbitrajul atâta timp cât condiția profitului de peste 1% este îndeplinită. În comparație, Agentul AI poate ajusta automat strategia. De exemplu, când profitul unei tranzacții depășește 1%, dar analiza datelor arată că riscul este prea mare, iar piața ar putea să se schimbe brusc, provocând pierderi, acesta va decide să nu execute acel arbitraj.
Astfel, Agentul AI are capacitatea de auto-adaptare, iar avantajul său principal constă în abilitatea de a învăța singur și de a lua decizii autonome, interacționând cu mediul (de exemplu, piața, comportamentul utilizatorilor etc.) și ajustând strategiile de comportament în funcție de semnalele de feedback, îmbunătățind constant eficiența executării sarcinilor. De asemenea, poate lua decizii în timp real pe baza datelor externe și poate optimiza continuu strategiile de decizie prin învățare prin întărire.
Așa că, se poate spune că este puțin similar cu un solver în cadrul intențiilor? Agentul AI este, de asemenea, un produs bazat pe intenții, iar cea mai mare diferență între acesta și solverul din cadrul intențiilor este că solverul se bazează pe algoritmi preciși, având rigurozitate matematică, în timp ce deciziile Agentului AI depind de antrenarea pe date, adesea necesitând o apropiere de soluția optimă prin încercări și erori în timpul procesului de antrenare.
Cadrele principale ale Agentului AI
Cadrul Agentului AI este infrastructura utilizată pentru a crea și gestiona agenți inteligenți. În prezent, în Web3, cadrele populare includ Eliza de la ai16z, ZerePy de la zerebro și GAME de la Virtuals.
Eliza este un cadru multifuncțional pentru Agenți AI, construit pe TypeScript, care suportă operarea pe mai multe platforme (precum Discord, Twitter, Telegram etc.) și, printr-o gestionare complexă a memoriei, poate reține conversațiile și contextul anterior, menținând caracteristici de personalitate și răspunsuri de cunoștințe consistente. Eliza utilizează un sistem RAG (Retrieval Augmented Generation), care permite accesarea bazelor de date externe sau a resurselor pentru a genera răspunsuri mai precise. În plus, Eliza integrează pluginuri TEE, permițând desfășurarea în TEE, asigurând astfel securitatea și confidențialitatea datelor.
GAME este cadrul care împuternicește și conduce Agenții AI să ia decizii autonome și să acționeze. Dezvoltatorii pot personaliza comportamentul agenților în funcție de nevoile proprii, extinzându-le funcționalitățile și oferind operațiuni personalizate (precum postări pe rețele sociale, răspunsuri etc.). Funcționalitățile diferite din cadrul acestui cadru, cum ar fi poziția mediului agenților și sarcinile, sunt împărțite în module multiple, facilitând configurarea și gestionarea de către dezvoltatori. Cadrul GAME împarte procesul de decizie al Agentului AI în două niveluri: planificare de înalt nivel (HLP) și planificare de nivel inferior (LLP), fiecare responsabilă pentru sarcini și decizii la diferite niveluri. Planificarea de înalt nivel este responsabilă pentru stabilirea obiectivelor generale ale agenților și planificarea sarcinilor, formulând decizii pe baza obiectivelor, personalităților, informațiilor de fundal și stării mediului, stabilind prioritățile sarcinilor. Planificarea de nivel inferior se concentrează pe executare, transformând deciziile de planificare de înalt nivel în pași de acțiune specifici, alegând funcționalitățile și metodele de operare adecvate.
ZerePy este un cadru open-source Python, utilizat pentru desfășurarea Agenților AI pe X. Acest cadru integrează LLM furnizate de OpenAI și Anthropic, permițând dezvoltatorilor să construiască și să gestioneze agenți pentru rețele sociale, automatizând operațiuni precum postarea de tweeturi, răspunsul la tweeturi, darea de like etc. Fiecare sarcină poate avea setate ponderi diferite în funcție de importanța sa. ZerePy oferă o interfață de linie de comandă (CLI) simplă, facilitând dezvoltatorilor pornirea rapidă și gestionarea agenților. În plus, cadrul oferă un șablon Replit (o platformă online de editare și execuție a codului), permițând dezvoltatorilor să înceapă rapid utilizarea ZerePy fără a necesita configurații complexe ale mediului local.
De ce se confruntă Agentul AI cu FUD?
Agentul AI pare inteligent, având capacitatea de a reduce barierele de intrare și de a îmbunătăți experiența utilizatorului, de ce există FUD în comunitate? Motivul este că Agentul AI este, în esență, doar un instrument, care în prezent nu poate finaliza întregul flux de lucru, ci doar îmbunătățește eficiența și economisește timp în anumite puncte. De asemenea, în etapa actuală de dezvoltare, rolul Agentului AI este, în mare parte, de a ajuta utilizatorii să emită MeMe-uri cu un singur clic și să gestioneze conturi de rețele sociale. Comunitatea glumește spunând că „activele aparțin dezvoltatorilor, iar pasivele aparțin AI”.
Cu toate acestea, chiar săptămâna aceasta, aiPool a lansat Agentul AI ca parte a vânzării preliminare a tokenurilor, utilizând tehnologia TEE pentru a realiza descentralizarea. Cheia privată a portofelului acestui Agent AI este generată dinamic în mediul TEE, asigurând securitatea. Utilizatorii pot trimite fonduri (de exemplu, SOL) către portofelul controlat de Agentul AI, care, conform regulilor stabilite, va crea tokenuri și va lansa un pool de lichiditate pe DEX, distribuind tokenuri către investitorii eligibili. Întregul proces nu depinde de niciun intermediar terț, fiind complet realizat de Agentul AI în mediul TEE, evitând riscurile comune de tip rug pull în DeFi. Este evident că Agentul AI se dezvoltă treptat. Cred că Agentul AI poate ajuta utilizatorii să reducă barierele de intrare și să îmbunătățească experiența, chiar dacă doar simplifică o parte din procesul de emitere a activelor, este semnificativ. Dar, dintr-o perspectivă macro a Web3, Agentul AI, fiind un produs off-chain, în stadiul actual, joacă doar rolul de instrument auxiliar pentru contractele inteligente, deci nu ar trebui să ne lăudăm excesiv cu capacitățile sale. De asemenea, în a doua jumătate a acestui an, în afară de MeMe, nu au existat narațiuni semnificative de efect de avere, astfel că hype-ul Agentului AI, în jurul MeMe-ului, a fost normal. Numai MeMe nu poate menține o valoare pe termen lung, așa că, dacă Agentul AI poate aduce mai multe inovații în procesul de tranzacționare, oferind o valoare concretă, ar putea deveni un instrument de infrastructură comun.