Autorul original: YBB Capital Researcher Zeke

I. Începutul cu capriciile atenției

În ultimul an, din cauza întreruperii narativului la nivelul aplicațiilor, care nu a putut ține pasul cu viteza de expansiune a infrastructurii, domeniul criptomonedelor a devenit treptat un joc de captare a resurselor de atenție. De la Silly Dragon la Goat, de la Pump.fun la Clanker, capriciile atenției au dus la o competiție internă acerbă. Începând cu cele mai banale strategii de atragere a atenției, s-a trecut rapid la un model de platformă unificată pentru cererea și oferta de atenție, ajungând la biologia pe bază de siliciu care devine noul furnizor de conținut. În mijlocul diverselor forme de Meme Coin, a apărut în sfârșit o entitate care poate aduce laolaltă investitorii de retail și VC-uri: Agentul AI.

Atenția este în cele din urmă o joc zero-sum, dar speculațiile pot, într-adevăr, să stimuleze creșterea necontrolată a lucrurilor. În articolul nostru despre UNI, am revizuit începutul epocii de aur a blockchain-ului; creșterea rapidă a DeFi a fost generată de începutul erei LP mining deschisă de Compound Finance. A intra și a ieși din diverse piscine de minerit cu APY-uri de mii sau chiar zeci de mii era cea mai primitivă formă de joc pe blockchain în acea perioadă, deși rezultatul final a fost prăbușirea diverselor piscine. Totuși, influxul nebun al minerilor de aur a lăsat blockchain-ului o lichiditate fără precedent, iar DeFi a reușit să se desprindă de pură speculație și să formeze o pistă matură, satisfăcând nevoile financiare ale utilizatorilor în toate aspectele, inclusiv plăți, tranzacții, arbitraj, staking etc. În prezent, Agentul AI trece și el prin această fază necontrolată; căutăm modul în care Crypto poate fuziona mai bine cu AI și, în cele din urmă, să permită aplicațiilor să atingă noi culmi.

II. Cum acționează Agentul în mod autonom

În articolul anterior, am prezentat pe scurt originile AI Meme: Truth Terminal și perspectivele asupra viitorului Agentului AI; acest articol se concentrează în primul rând pe Agentul AI în sine.

Începem prin a discuta definiția Agentului AI; Agentul în domeniul AI este un termen mai vechi, dar nedefinit, care subliniază în principal autonomia, adică orice AI care poate percepe mediul și reacționa se poate numi Agent. În definiția actuală, Agentul AI se apropie mai mult de agent, adică se stabilește un sistem care imită deciziile umane pentru un model mare, acest sistem fiind considerat de comunitatea academică ca fiind cel mai promițător drum spre AGI (Inteligența Artificială Generală).

În versiunile timpurii ale GPT, am putut observa clar că modelele mari sunt foarte asemănătoare cu oamenii, dar când vine vorba de răspunsurile la multe probleme complexe, modelele mari ofereau doar răspunsuri vagi. Motivul fundamental este că modelele mari de atunci se bazau pe probabilitate și nu pe cauzalitate, și că le lipseau abilitățile de utilizare a uneltelor, memorie, planificare etc., pe care le au oamenii, iar Agentul AI poate completa aceste deficiențe. Așadar, putem rezuma cu o formulă: Agent AI (Agent inteligent) = LLM (model mare) + Planificare + Memorie + Unelte.

Modelele mari bazate pe prompturi (Prompt) sunt mai degrabă ca o persoană statică; ele prind viață doar când le introducem date. Scopul agentului este de a fi o persoană mai reală. În prezent, agenții din domeniu se bazează în principal pe modele ajustate ale versiunilor Llama 70 b sau 405 b de la Meta (cu parametri diferiți), având capacitatea de a memora și de a utiliza API-uri pentru a accesa instrumente. În alte privințe, este posibil să aibă nevoie de ajutor sau input din partea umanului (inclusiv interacțiunea și colaborarea cu alți agenți). Astfel, observăm că principala formă de agent din prezent este reprezentată de KOL-uri care există pe rețelele sociale. Pentru a face agenții mai asemănători oamenilor, trebuie să integreze abilități de planificare și acțiune, iar sub-elementul lanțului de gândire din planificare este deosebit de important.

III. Lanțul de gândire (Chain of Thought, CoT)

Conceptul de lanț de gândire (Chain of Thought, CoT) a apărut pentru prima dată în 2022 în lucrarea publicată de Google (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), care subliniază că generarea unei serii de pași intermediar poate îmbunătăți capacitatea de raționare a modelului, ajutându-l să înțeleagă și să rezolve mai bine problemele complexe.

Un prompt tipic CoT conține trei părți: o descriere clară a sarcinii, o bază logică care susține soluționarea sarcinii, sau principii teoretice, și exemple de soluții specifice. Această structură ajută modelul să înțeleagă cerințele sarcinii, apropiindu-se treptat de răspuns prin raționare logică, sporind astfel eficiența și acuratețea soluționării problemelor. CoT este deosebit de potrivit pentru sarcini care necesită analize profunde și raționamente în mai multe etape, cum ar fi rezolvarea problemelor matematice, redactarea rapoartelor de proiect etc. În cazul sarcinilor simple, CoT poate să nu aducă avantaje evidente, dar pentru sarcini complexe, poate îmbunătăți semnificativ performanța modelului, reducând rata erorilor prin strategii de soluționare pas cu pas.

În construirea Agentului AI, CoT joacă un rol crucial, Agentul AI trebuie să înțeleagă informațiile primite și să ia decizii raționale pe baza acestora, CoT ajută Agentul să proceseze și să analizeze eficient informațiile de intrare prin furnizarea unui mod de gândire ordonat, transformând rezultatele analizei în ghiduri de acțiune specifice. Această metodă nu numai că îmbunătățește fiabilitatea și eficiența deciziilor Agentului, dar crește și transparența procesului decizional, făcând comportamentul Agentului mai predictibil și mai ușor de urmărit. CoT, prin descompunerea sarcinilor în pași mici, ajută Agentul să ia în considerare cu atenție fiecare punct de decizie, reducând erorile de decizie cauzate de suprasarcina de informații. CoT face procesul decizional al Agentului mai transparent, facilitând utilizatorilor înțelegerea bazei decizionale a Agentului. În interacțiunea cu mediul, CoT permite Agentului să învețe informații noi și să își ajusteze strategiile de comportament.

CoT, ca o strategie eficientă, nu numai că îmbunătățește capacitățile de raționare ale modelelor de limbaj mari, dar joacă și un rol important în construirea unor Agenți AI mai inteligenți și mai fiabili. Prin utilizarea CoT, cercetătorii și dezvoltatorii pot crea sisteme inteligente mai bine adaptate la medii complexe, având un grad înalt de autonomie. CoT a demonstrat avantaje unice în aplicațiile practice, în special în gestionarea sarcinilor complexe, descompunând sarcinile în pași mici, ceea ce nu doar că îmbunătățește acuratețea soluționării sarcinilor, ci și crește interpretabilitatea și controlabilitatea modelului. Această metodă de soluționare pas cu pas poate reduce semnificativ erorile de decizie cauzate de informații excesive sau prea complexe atunci când se confruntă cu sarcini complexe. În același timp, această metodă îmbunătățește trasabilitatea și verificabilitatea întregii soluții.

Funcția principală a CoT este de a combina planificarea, acțiunea și observația pentru a umple golul dintre raționare și acțiune. Acest mod de gândire permite Agentului AI să dezvolte strategii eficiente în anticiparea posibilelor anomalii și, în același timp, să acumuleze informații noi și să verifice previziunile stabilite anterior, oferind noi baze de raționare. CoT este ca un motor puternic de precizie și stabilitate, ajutând Agentul AI să mențină o eficiență de lucru ridicată în medii complexe.

IV. Cerințele false corecte

Ce aspecte ale tehnologiei AI ar trebui să se integreze cu Crypto? În articolul de anul trecut, am susținut că descentralizarea puterii de calcul și a datelor este un pas cheie pentru a ajuta micile afaceri și dezvoltatorii individuali să economisească costuri, iar în acest an, în segmentul Crypto x AI organizat de Coinbase, am observat o clasificare mai detaliată:

(1) Strat de calcul (se referă la rețele care se concentrează pe furnizarea de resurse de unități de procesare grafică (GPU) dezvoltatorilor AI);

(2) Strat de date (se referă la rețele care sprijină accesul, orchestration și verificarea descentralizată a datelor AI);

(3) Strat de middleware (se referă la platformele sau rețelele care sprijină dezvoltarea, desfășurarea și găzduirea modelului AI sau a agentului);

(4) Strat de aplicații (se referă la produsele orientate spre utilizatori care utilizează mecanisme AI pe blockchain, fie B2B, fie B2C).

În aceste patru straturi definite, fiecare strat are viziuni grandioase, iar obiectivele lor, în esență, sunt toate menite să contracareze dominarea gigantilor din Silicon Valley în următoarea eră a internetului. Așa cum am spus anul trecut, trebuie să acceptăm că giganții din Silicon Valley controlează exclusiv puterea de calcul și datele? În cadrul modelului închis monopolizat de ei, există o cutie neagră. Știința, ca fiind cea mai credincios religie a umanității de astăzi, în viitor, fiecare răspuns dat de modelul mare va fi văzut ca adevăr de către o mare parte din oameni, dar cum poate fi verificat acest adevăr? Conform viziunii giganților din Silicon Valley, autoritatea pe care o va avea agentul în cele din urmă va depăși imaginația, de exemplu, având dreptul de plată din portofelul tău, dreptul de utilizare a terminalului, cum se poate asigura că omul nu are intenții rele?

Descentralizarea este singura soluție, dar uneori trebuie să ne gândim rațional la câți plătitori există pentru aceste viziuni grandioase. În trecut, puteam compensa erorile idealizate prin Token fără a considera un ciclu comercial. Situația actuală este însă foarte gravă; Crypto x AI trebuie să se combine cu realitatea în procesul de proiectare, de exemplu, cum se poate echilibra oferta de ambele părți în condiții de pierdere de performanță și instabilitate în stratul de putere de calcul? pentru a realiza competitivitatea unui cloud centralizat. Câte utilizatori reali vor avea proiectele din stratul de date, cum putem verifica autenticitatea datelor furnizate și ce tipuri de clienți au nevoie de aceste date? Celelalte straturi de nivel secundar sunt similare; în această eră, nu avem nevoie de atât de multe cerințe false care par corecte.

V. Meme a ieșit în evidență în SocialFi

Așa cum am spus în primul paragraf, Meme a ieșit într-un mod extrem de rapid, creând o formă de SocialFi adaptată pentru Web3. Friend.tech este aplicația Dapp care a tras primul foc al acestei runde de aplicații sociale, dar a eșuat din păcate din cauza unui design de token prea grăbit. Pump.fun a demonstrat viabilitatea platformizării pure, fără a crea tokenuri sau reguli. Cererea și oferta de atenție sunt unite, poți publica meme-uri, face live, emite monede, comenta, tranzacționa, totul este liber; Pump.fun percepe doar un comision pentru servicii. Acest lucru este practic identic cu modelul economiei atenției al rețelelor sociale de astăzi, precum YouTube, Ins etc., doar că subiecții de plată sunt diferiți, iar în ceea ce privește gameplay-ul, Pump.fun tinde mai mult spre Web3.

Clanker de la Base este un adevărat campion, beneficiind de ecosistemul integrat gestionat personal de ecologie, Base are propria aplicație socială Dapp ca suport, formând un cerc intern complet. Agentul inteligent Meme este forma 2.0 a Meme Coin, oamenii caută întotdeauna noutate, iar Pump.fun se află acum în centrul atenției, din punct de vedere al tendinței, aberațiile biologiei pe bază de siliciu înlocuind meme-urile banale pe bază de carbon sunt doar o chestiune de timp.

Am menționat deja de nenumărate ori Base, iar de fiecare dată conținutul este diferit; din punct de vedere temporal, Base nu a fost niciodată un inovator, dar întotdeauna a ieșit învingător.

VI. Ce altceva poate fi un agent?

Dintr-o perspectivă pragmatică, agenții nu vor putea fi descentralizați pentru o perioadă lungă de timp în viitor; având în vedere construcția agenților în domeniul AI tradițional, nu este o problemă simplă de descentralizare și open-source a procesului de raționare. Este nevoie de integrarea diferitelor API-uri pentru a accesa conținutul Web2, costurile de operare sunt foarte mari, iar proiectarea lanțului de gândire și colaborarea între agenți depind în continuare de un om ca mediator. Vom trăi o perioadă de tranziție foarte lungă, până când va apărea o formă de fuzionare adecvată, poate la fel ca UNI. Dar așa cum am spus în articolul precedent, cred că agenții vor avea un impact semnificativ asupra industriei noastre, așa cum Cex a existat în industria noastră, nu este corect, dar este foarte important.

Articolul publicat luna trecută de Stanford Microsoft (rezumat despre Agentul AI) a descris pe larg aplicațiile agenților în domeniul medical, mașinile inteligente și lumea virtuală, iar în anexele acestui articol există deja multe cazuri de experimentare cu GPT-4 V ca agent care participă la dezvoltarea jocurilor AAA de top.

Nu trebuie să ne forțăm să combinăm viteza cu descentralizarea; mi-ar plăcea să văd că agenții completează mai întâi puzzle-ul abilităților și vitezei din partea de jos în sus; avem atât de multe ruine narative și un metavers gol pe care trebuie să le umplem, iar la momentul potrivit vom considera cum să facem din ei următorul UNI.

Referințe

Ce capacitate are lanțul de gândire (CoT) care a apărut în modelele mari? Autor: Naoji T.

Într-un articol care explică Agentul, următoarea etapă a modelului mare. Autor: LinguaMind