Titlul original: (Era agenților: confruntarea și simbioza AI cu Crypto)

Autor original: YBB Capital Research

Unu, începutul atenției și plictiselii

În ultimul an, din cauza întreruperii narațiunii la nivelul aplicațiilor, care nu a putut ține pasul cu viteza explozivă a infrastructurii, domeniul criptografic a devenit treptat un joc de competiție pentru resursele de atenție. De la Silly Dragon la Goat, de la Pump.fun la Clanker, plictiseala față de atenție a dus la o bătălie internă. Cu cele mai banale metode de atragere a atenției ca punct de plecare, s-a trecut rapid la un model de platformă unificat între cererea și oferta de atenție, până când biologia pe bază de siliciu a devenit un nou furnizor de conținut. Printre vehiculele bizare ale Meme Coin a apărut în cele din urmă o entitate care poate aduce la un consens retaileri și VC: Agentul AI.

Atenția este în cele din urmă un joc cu sumă zero, dar speculația poate, de asemenea, să stimuleze creșterea barbară a lucrurilor. În articolul nostru despre UNI, am revizuit începutul epocii de aur a blockchain-ului, iar creșterea rapidă a DeFi a fost provocată de era minării LP inițiată de Compound Finance, intrările și ieșirile din diverse piscine de minare cu APY de mii sau chiar zeci de mii au fost cea mai primitivă formă de joc pe blockchain în acea perioadă, deși situația finală a fost colapsul diverselor piscine. Totuși, afluxul nebun al minerilor de aur a lăsat blockchain-ul cu o lichiditate fără precedent, iar DeFi a reușit în cele din urmă să depășească speculațiile pure, formând un segment matur care satisface nevoile financiare ale utilizatorilor în diverse aspecte, cum ar fi plățile, tranzacțiile, arbitrajul, staking-ul etc. În această etapă, Agentul AI trece și el prin această etapă barbară, iar ceea ce căutăm este cum poate Crypto să se integreze mai bine cu AI și, în cele din urmă, să permită stratului de aplicație să atingă noi culmi.

Doi, cum își exercită agenții autonomia

Am discutat pe scurt în articolul anterior despre originea Meme-ului AI: Truth Terminal, precum și perspectivele pentru viitorul Agentului AI, iar acest articol se concentrează în primul rând asupra Agentului AI în sine.

Să începem cu definiția Agentului AI, Agent în domeniul AI este un termen mai vechi, dar nedefinit, care subliniază în principal autonomia, adică orice AI care poate percepe mediul și reacționa poate fi numit Agent. În definiția actuală, Agentul AI este mai aproape de un agent inteligent, adică setăm un sistem care imită deciziile umane pentru modelul mare, iar în mediul academic, acest sistem este considerat a fi cea mai promițătoare cale către AGI (Inteligență Artificială Generală).

În versiunile timpurii ale GPT, am putut percepe clar că modelul mare seamănă cu un om, dar în răspunsurile la multe întrebări complexe, modelul mare putea oferi doar răspunsuri oarecum plauzibile. Motivul fundamental este că modelul de atunci se baza pe probabilitate, nu pe cauzalitate, și de asemenea îi lipseau abilitățile umane de a utiliza unelte, memorie, planificare etc., pe care Agentul AI le poate completa. Așadar, putem rezuma cu o formulă: Agent AI (inteligent) = LLM (model mare) + Planificare + Memorie + Unelte.

Modelele mari bazate pe cuvinte cheie (Prompt) sunt mai degrabă ca o persoană statică, au viață doar atunci când le introducem, obiectivul agenților este să fie o persoană mai reală. În prezent, agenții din domeniu sunt în principal modele ajustate bazate pe versiuni Llama 70b sau 405b open-source de către Meta (cele două au parametrii diferiți), având capacitatea de memorie și de utilizare a instrumentelor API. În alte privințe, ar putea necesita ajutorul sau inputul uman (inclusiv interacțiunea cu alți agenți). Astfel, putem observa că agenții principali din zilele noastre există în principal sub forma KOL în rețelele sociale. Pentru a face agenții să semene mai mult cu oamenii, trebuie să integreze capacități de planificare și acțiune, iar sub-elementul lanțului de gândire din planificare este deosebit de crucial.

Trei, Lanț de gândire (Chain of Thought, CoT)

Conceptul de lanț de gândire (Chain of Thought, CoT) a apărut pentru prima dată în 2022 în documentul publicat de Google (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), care sugerează că se poate îmbunătăți capacitatea de raționare a modelului generând o serie de pași intermediari de raționare, ajutând modelul să înțeleagă și să rezolve mai bine problemele complexe.

Un prompt tipic CoT conține trei părți: descrierea clară a sarcinii, logica care susține soluționarea sarcinii, baza teoretică sau principiul, exemplul soluției specifice. Această structură organizată ajută modelul să înțeleagă cerințele sarcinii, apropiindu-se progresiv de răspuns prin raționare logică, îmbunătățind astfel eficiența și acuratețea soluționării problemelor. CoT este deosebit de potrivit pentru sarcini care necesită analize profunde și raționare în mai multe etape, cum ar fi rezolvarea problemelor matematice, redactarea rapoartelor de proiect etc. În cazul sarcinilor simple, CoT poate să nu aducă avantaje evidente, dar pentru sarcinile complexe, poate îmbunătăți semnificativ performanța modelului, reducând rata de erori prin strategii de soluționare pas cu pas și îmbunătățind calitatea finalizării sarcinii.

În construirea Agentului AI, CoT joacă un rol crucial, Agentul AI trebuie să înțeleagă informațiile primite și să ia decizii raționale pe baza acestora, CoT oferă o modalitate ordonată de gândire, ajutând Agentul să proceseze și să analizeze eficient informațiile de intrare, transformând rezultatul în ghiduri de acțiune specifice. Această metodă nu doar că îmbunătățește fiabilitatea și eficiența deciziilor Agentului, ci crește și transparența procesului decizional, făcând comportamentul Agentului mai predictibil și mai ușor de urmărit. CoT, prin împărțirea sarcinilor în pași mici, ajută Agentul să analizeze atent fiecare punct decizional, reducând erorile cauzate de suprasarcina de informații. CoT face ca procesul decizional al Agentului să fie mai transparent, utilizatorii având mai multă ușurință în a înțelege baza deciziilor Agentului. În interacțiunea cu mediul, CoT permite Agentului să învețe constant informații noi și să-și ajusteze strategiile de comportament.

CoT, ca o strategie eficientă, nu doar că îmbunătățește capacitatea de raționare a modelului mare de limbaj, ci joacă și un rol important în construirea unor agenți AI mai inteligenți și mai fiabili. Prin utilizarea CoT, cercetătorii și dezvoltatorii pot crea sisteme inteligente mai adaptate la medii complexe, cu un grad înalt de autonomie. CoT a demonstrat avantaje unice în aplicațiile sale practice, în special în gestionarea sarcinilor complexe, prin descompunerea sarcinilor în pași mici, nu doar că îmbunătățește acuratețea soluțiilor, dar sporește și interpretabilitatea și controlabilitatea modelului. Această abordare pas cu pas pentru rezolvarea problemelor poate reduce semnificativ erorile în fața sarcinilor complexe, cauzate de suprainformație sau complexitate excesivă. În același timp, această metodă îmbunătățește trasabilitatea și verificabilitatea întregii soluții.

Funcția principală a CoT este de a combina planificarea, acțiunea și observația, compensând decalajul dintre raționare și acțiune. Acest mod de gândire permite Agentului AI să dezvolte strategii eficiente atunci când prezice situații anormale care ar putea apărea, precum și să acumuleze informații noi în timp ce interacționează cu mediul extern, validând predicțiile predefinite și oferind noi baze de raționare. CoT este ca un motor puternic de precizie și stabilitate, ajutând Agentul AI să mențină eficiența în medii complexe.

Patru, cererile false corecte

Ce aspecte ale tehnologiei AI ar trebui să fie integrate în Crypto? În articolul de anul trecut, am considerat că descentralizarea puterii de calcul și a datelor este un pas esențial pentru a ajuta micile afaceri și dezvoltatorii individuali să economisească costuri, iar anul acesta, în cadrul segmentului Crypto x AI organizat de Coinbase, am observat o diviziune mai detaliată:

(1)Stratul de calcul(se referă la rețelele care se concentrează pe furnizarea de unități de procesare grafică (GPU) pentru dezvoltatorii AI);

(2)Stratul de date(se referă la rețelele care sprijină accesul descentralizat, orchestrat și validat al datelor AI);

(3)Stratul de middleware(se referă la platformele sau rețelele care sprijină dezvoltarea, desfășurarea și găzduirea modelelor sau agenților AI);

(4)Stratul de aplicație(se referă la produsele orientate către utilizator care utilizează mecanisme AI pe blockchain, fie B2B, fie B2C)。

În aceste patru straturi distincte, fiecare strat are viziuni grandioase, iar obiectivele sunt, în esență, de a contracara dominația gigantilor din Silicon Valley asupra internetului în era următoare. Așa cum am spus anul trecut, trebuie cu adevărat să acceptăm că gigantii din Silicon Valley controlează exclusiv puterea de calcul și datele? În subsolul modelului mare închis monopolizat de ei există o cutie neagră, iar știința, ca cea mai credință religioasă a omenirii, va face ca fiecare răspuns al modelului mare să fie perceput ca adevăr de o mare parte din oameni, dar cum poate fi validat acest adevăr? Conform viziunilor gigantilor din Silicon Valley, permisiunile deținute de agenți vor depăși orice imaginație, cum ar fi dreptul de plată din portofelul tău, dreptul de utilizare a terminalului, cum putem garanta că oamenii nu au intenții rele?

Descentralizarea este singurul răspuns, dar uneori trebuie să ne gândim rațional la câți plătitori ai acestor viziuni grandioase există. În trecut, puteam compensa erorile generate de idealizare prin token-uri fără a considera un ciclu comercial închis. Dar situația actuală este foarte severă, Crypto x AI trebuie să se integreze în situațiile reale pentru a face designul, de exemplu, cum ar trebui să echilibreze cele două capete în stratul de putere de calcul în condiții de pierderi de performanță și instabilitate? pentru a realiza competitivitatea centrului de cloud centralizat. Câte utilizatori reali vor avea proiectele din stratul de date, cum putem verifica validitatea și veridicitatea datelor oferite și ce tip de clienți au nevoie de aceste date? Restul stratelor urmează aceeași logică, în această eră nu avem nevoie de atât de multe cereri false care par corecte.

Cinco, Meme a ieșit din SocialFi

Așa cum am menționat în primul paragraf, Meme a ieșit într-un mod ultra-rapid, formând o formă SocialFi compatibilă cu Web3. Friend.tech este Dapp-ul care a tras primul foc în această rundă de aplicații sociale, dar a eșuat din cauza designului grăbit al token-ului. Pump.fun a validat viabilitatea pur platformizată, fără a crea token-uri sau a stabili reguli. Cererea și oferta de atenție sunt unite, poți publica meme-uri, face streaming, emite monede, lăsa mesaje, tranzacționa, totul este liber, Pump.fun percepe doar o taxă de serviciu. Aceasta este în concordanță cu modelul economiei atenției din zilele noastre de pe YouTube, Ins etc., doar că subiecții de taxare sunt diferiți, iar în ceea ce privește jocul, Pump.fun este mai Web3.

Clanker de la Base este un adevărat integrator, beneficiind de un ecosistem unificat gestionat de ecosistemul propriu, Base are propriul Dapp social ca suport, formând un ciclu intern complet. Agentul Meme este forma 2.0 a Meme Coin, oamenii caută întotdeauna noutate, iar Pump.fun se află acum într-un moment de vârf, dintr-o perspectivă de tendințe, înlocuirea biologiei pe bază de siliciu cu meme-urile vulgare pe bază de carbon este doar o chestiune de timp.

Am menționat deja Base de nenumărate ori, doar că de fiecare dată am abordat un alt aspect, din perspectiva cronologică, Base nu a fost niciodată un inițiator, dar întotdeauna a fost câștigător.

Șase, ce altceva poate fi agentul?

Dintr-o perspectivă pragmatică, agenții nu vor putea fi descentralizați pentru o perioadă lungă de timp în viitor. Privind construcția agenților în domeniul AI tradițional, nu este o simplă problemă de descentralizare și open-source, ci necesită integrarea diverselor API-uri pentru a accesa conținutul Web2, iar costurile de operare sunt foarte mari. Designul lanțului de gândire și colaborarea între agenți de obicei depind de un om ca intermediar. Vom experimenta o perioadă de tranziție lungă, până când va apărea o formă de fuzionare potrivită, poate la fel ca UNI. Dar ca în articolul anterior, cred în continuare că agenții vor avea un impact semnificativ asupra industriei noastre, așa cum prezența Cex a avut în industria noastră, nu este corect, dar este foarte important.

Un articol (Revizuirea agenților AI) publicat luna trecută de Stanford & Microsoft descrie pe larg aplicațiile agenților în domeniul medical, mașinile inteligente și lumea virtuală, iar în anexa acestui articol există deja foarte multe cazuri experimentale în care GPT-4V participă ca agent în dezvoltarea jocurilor de top 3A.

Nu trebuie să ne forțăm prea mult asupra vitezei cu care se combină cu descentralizarea, prefer să văd că agenții completează mai întâi puzzle-ul abilităților și vitezei de jos în sus, avem atât de multe ruine narative și un metavers gol de umplut, la momentul potrivit vom considera cum să-l facem să devină următorul UNI.

Referințe:

Ce capacitate are lanțul de gândire emergent al modelului mare? Autor: Născut din creier

O privire de ansamblu asupra Agentului, următoarea stație a modelului mare Autor: LinguaMind

Acest articol provine dintr-o contribuție și nu reprezintă opinia BlockBeats.