Původní autor: YBB Capital Researcher Zeke

Začíná to novinkami z pozornosti

V uplynulém roce se kvůli nedostatku narativu na aplikační úrovni, který by odpovídal rychlosti rozvoje infrastruktury, kryptoměnové odvětví postupně proměnilo v hru o získání pozornosti. Od Silly Dragon po Goat, od Pump.fun po Clanker, neustálé hledání novinek v oblasti pozornosti vedlo k neustálému vnitřnímu boji. Vše začalo nejklasičtějším způsobem, jak přitáhnout pozornost k monetizaci, rychle se transformovalo na platformový model, kde se sjednotili poptávající a dodávající pozornost, a nakonec silikónové bytosti se staly novými dodavateli obsahu. Meme Coin konečně našlo existenci, která umožňuje retailovým investorům a VC dosáhnout konsensu: AI agent.

Pozornost je nakonec nulová suma, ale spekulace mohou také podnítit divoký růst. V našem článku o UNI jsme už zmiňovali začátek zlaté éry blockchainu, rychlý růst DeFi vycházel z doby LP těžby, kterou otevřela Compound Finance. Vstup a výstup z tisíců, ba dokonce desítek tisíc různých těžebních bazénů byl v té době nejprimitivnějším způsobem řetězového boje, i když konečná situace byla, že různé bazény se zhroutily. Ale šílený příliv zlatých horníků skutečně zanechal blockchainu bezprecedentní likviditu, a DeFi nakonec uniklo z čistého spekulování a vytvořilo zralou oblast, která uspokojila finanční potřeby uživatelů ve všech aspektech, jako jsou platby, obchodování, arbitráž a staking. A AI agent v současné fázi také prochází tímto divokým obdobím a my zkoumáme, jak může Crypto lépe integrovat AI a nakonec povzbudit aplikační úroveň k dosažení nových výšin.

Jak agenti jednají autonomně

V předchozím článku jsme stručně představili původ AI Meme: Truth Terminal a výhled do budoucnosti AI agenta, tento článek se zaměřuje především na samotného AI agenta.

Začněme definicí AI agenta. Agent je v oblasti AI poměrně starý, ale nejednoznačný termín, který se především zaměřuje na autonomii. To znamená, že jakýkoli AI, který dokáže vnímat své okolí a reagovat na něj, lze považovat za agenta. V současné definici se AI agent blíží inteligentnímu agentovi, což je systém, který nastavuje velkému modelu sadu, která napodobuje lidské rozhodování. Tato soustava je v akademickém prostředí považována za nejperspektivnější cestu k AGI (obecné umělé inteligenci).

V raných verzích GPT jsme jasně cítili, že velký model je velmi podobný člověku, ale při odpovědích na složité otázky mohl velký model poskytnout pouze nejasné odpovědi. Podstatou je, že tehdejší velký model byl založen na pravděpodobnosti, nikoli na příčinnosti, a navíc mu chyběly schopnosti, které mají lidé, jako je používání nástrojů, paměť, plánování atd., a AI agent může tyto nedostatky vyrovnat. Takže vzorec by mohl být shrnut takto: AI agent (inteligentní agent) = LLM (velký model) + Plánování + Paměť + Nástroje.

Model založený na výzvách (Prompt) je více jako statická entita; ožívá, až když zadáme vstup. Cílem agenta je být realističtější. V současnosti jsou agenti v oboru většinou založeni na doladěných modelech Meta open source Llama 70b nebo 405b (s různými parametry), mají schopnost pamatovat si a používat API k připojení k nástrojům, a v jiných ohledech mohou potřebovat pomoc nebo vstupy od lidí (včetně interakce a spolupráce s jinými agenty), takže vidíme, že většina současných agentů v oboru existuje spíše ve formě KOL na sociálních sítích. Aby agent vypadal více jako člověk, je třeba připojit plánovací a akční schopnosti, přičemž podúkol myšlenkového řetězce je obzvlášť klíčový.

Myšlenkový řetězec (Chain of Thought, CoT)

Koncept myšlenkového řetězce (Chain of Thought, CoT) se poprvé objevil ve studii zveřejněné Googlem v roce 2022 (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), která ukázala, že generováním série mezilehlých uvažovacích kroků můžeme zvýšit uvažovací schopnosti modelu a pomoci mu lépe porozumět a řešit složité problémy.

Typický CoT Prompt obsahuje tři části: jasně definovaný úkolový popis, logické odůvodnění podporující řešení úkolu, teoretický základ nebo princip, konkrétní řešení. Tento strukturovaný přístup pomáhá modelu pochopit požadavky úkolu a postupně se přiblížit k odpovědi prostřednictvím logického uvažování, čímž se zvyšuje efektivita a přesnost řešení problémů. CoT je zvlášť vhodný pro úkoly, které vyžadují důkladnou analýzu a vícestupňové uvažování, jako jsou řešení matematických problémů nebo psaní projektových zpráv. U jednoduchých úkolů CoT nemusí přinést výrazné výhody, ale u složitých úkolů může výrazně zlepšit výkon modelu, snížit míru chyb a zvýšit kvalitu dokončení úkolu.

Při vytváření AI agenta hraje CoT klíčovou roli, AI agent musí porozumět přijatým informacím a na jejich základě učinit rozumná rozhodnutí. CoT poskytuje uspořádaný způsob myšlení, který pomáhá agentovi efektivně zpracovávat a analyzovat vstupní informace a převádět výsledky analýzy na konkrétní pokyny k jednání. Tento přístup nejen zvyšuje spolehlivost a efektivitu rozhodování agenta, ale také zvyšuje transparentnost rozhodovacího procesu, což činí chování agenta předvídatelnějším a sledovatelným. CoT rozdělením úkolu na více menších kroků pomáhá agentovi důkladně zvážit každé rozhodovací místo, čímž se snižuje riziko chybných rozhodnutí způsobených informačním přetížením. CoT činí rozhodovací proces agenta transparentnějším, což usnadňuje uživatelům pochopení podkladů pro rozhodování agenta. Při interakci s prostředím umožňuje CoT agentovi neustále se učit nové informace a upravovat strategie chování.

CoT jako efektivní strategie nejen zvyšuje schopnost velkých jazykových modelů uvažovat, ale také hraje důležitou roli při vytváření inteligentnějších a spolehlivějších AI agentů. Využitím CoT mohou výzkumníci a vývojáři vytvářet inteligentní systémy, které se lépe přizpůsobují složitým prostředím a mají vysokou míru autonomie. CoT ukázalo své jedinečné výhody v praxi, zejména při řešení složitých úkolů, kdy rozdělením úkolu na sérii malých kroků nejen zvyšuje přesnost řešení úkolu, ale také zlepšuje interpretovatelnost a kontrolovatelnost modelu. Tento postupný přístup k řešení problémů může výrazně snížit míru chybných rozhodnutí, které mohou nastat při čelení složitým úkolům kvůli nadměrnému nebo příliš složitému množství informací. Současně také zvyšuje sledovatelnost a ověřitelnost celého řešení.

Hlavní funkcí CoT je spojení plánování, jednání a pozorování, čímž se překonává mezera mezi uvažováním a jednáním. Tento způsob myšlení umožňuje AI agentovi formulovat účinné strategie v předstihu na základě očekávaných anomálních situací a zároveň shromažďovat nové informace při interakci s vnějším prostředím, ověřovat předem stanovené předpovědi a poskytovat nové důvody pro uvažování. CoT je jako silný motor přesnosti a stability, který pomáhá AI agentovi udržovat vysokou pracovní efektivitu v komplexním prostředí.

Správná falešná poptávka

Jaké aspekty AI technologického stacku by se měly spojit s Crypto? V loňském článku jsem tvrdil, že decentralizace výpočetního výkonu a dat je klíčovým krokem k úspoře nákladů pro malé podniky a jednotlivé vývojáře, a letos v segmentaci Crypto x AI od Coinbase jsme viděli podrobnější rozdělení:

(1) Výpočetní vrstva (odkazující na sítě zaměřené na poskytování zdrojů grafických procesorů (GPU) pro vývojáře AI);

(2) Datová vrstva (odkazující na sítě podporující decentralizovaný přístup, orchestraci a ověřování AI datových kanálů);

(3) Middleware vrstva (odkazující na platformy nebo sítě podporující vývoj, nasazení a hostování AI modelů nebo agentů);

(4) Aplikační vrstva (odkazující na uživatelské produkty využívající mechanismy AI na blockchainu, ať už B2B nebo B2C).

Ve čtyřech vymezených vrstvách má každá velkolepou vizi, jejímž cílem je v souhrnu čelit dominanci silikonských gigantů na internetu v příští éře. Jak jsem řekl minulý rok, opravdu musíme akceptovat, že silikonské giganty mají exkluzivní kontrolu nad výpočetním výkonem a daty? Jejich uzavřené velké modely jsou vnitřně černou skříňkou, věda, jakožto dnešní nejvíce uctívané náboženství, bude budoucí odpovědi velkých modelů považováno velkou částí lidí za pravdu. Ale jak tuto pravdu ověřit? Podle představ silikonských gigantů by agenti nakonec měli mít neuvěřitelné pravomoci, například právo na platby z vaší peněženky, právo používat zařízení, jak lze zajistit, že lidé nemají zlý úmysl?

Decentralizace je jedinou odpovědí, ale někdy musíme rozumně zvážit, kolik z těchto velkých vizí má skutečné plátce. V minulosti jsme mohli kompenzovat chyby idealizace pomocí tokenů, aniž bychom brali v úvahu obchodní uzavřený cyklus. Dnes je situace velmi vážná, Crypto x AI potřebuje více zohlednit reálné podmínky při návrhu, například jak vyvážit nabídku na obou stranách výpočetní vrstvy, když dojde k ztrátě výkonu a nestabilitě, aby se dosáhlo konkurenceschopnosti vůči centralizovanému cloudu? Kolik projektů na datové vrstvě bude mít skutečné uživatele, jak ověřit pravdivost poskytnutých dat, a jaký typ klientů tyto data potřebuje? Ostatní vrstvy platí totéž, v této době nepotřebujeme tolik zdánlivě správných falešných poptávkách.

Meme se dostalo do SocialFi

Jak jsem zmínil v první části, Meme už rychlým tempem vytvořil formu SocialFi, která odpovídá Web3. Friend.tech byl Dapp, který zahájil tuto vlnu sociálních aplikací, ale bohužel selhal kvůli příliš ambicióznímu návrhu tokenů. Pump.fun prokázal proveditelnost čistě platformového modelu, bez jakéhokoli tokenu nebo pravidel. Poptávající a dodávající pozornost se sjednotili, můžete na platformě sdílet vtipné obrázky, streamovat, vydávat tokeny, komentovat, obchodovat, vše je volné, Pump.fun si účtuje pouze poplatek za služby. To je v podstatě v souladu s modelem ekonomiky pozornosti na současných sociálních médiích, jako je YouTube, Instagram, ale s odlišnými poplatky; z hlediska hraní Pump.fun je více orientované na Web3.

Base Clanker je pak syntézou, díky integrovanému ekosystému, který je řízen ekologií, má Base vlastní sociální Dapp jako podporu a vytváří tak kompletní interní uzavřený cyklus. Inteligentní agent Meme je 2.0 verzí Meme Coin, lidé vždy hledají novinky, a Pump.fun se nyní nachází v centru pozornosti, z trendového pohledu je nahrazení nízkých vtipů na bázi uhlíku fantaziemi na bázi silikonu jen otázkou času.

Už jsem zmínil Base nespočetněkrát, jen s různým obsahem. Z časového hlediska Base nikdy nebyl prvním, ale vždy vítězem.

Co všechno může agent ještě být?

Z praktického hlediska je nepravděpodobné, že by agenti byli v blízké budoucnosti decentralizovaní. Z pohledu tradičního AI budování agentů to není problém, který lze vyřešit jednoduchým decentralizováním a otevřením zdrojů. Je nutné připojit různé API pro přístup k obsahu Web2, což je nákladné na provoz. Návrh myšlenkového řetězce a spolupráce více agentů obvykle stále závisí na člověku jako zprostředkovateli. Projdeme dlouhým přechodným obdobím, než se objeví vhodná integrační forma, možná něco jako UNI. Ale stejně jako v předchozím článku se domnívám, že agenti budou mít na naše odvětví velký dopad, podobně jako Cex v našem odvětví - ne správně, ale velmi důležité.

Stanford a Microsoft minulý měsíc vydaly článek (Přehled AI agenta), který rozsáhle popisuje aplikace agentů v oblasti zdravotnictví, inteligentních strojích a virtuálním světě, a v příloze tohoto článku je již velmi mnoho experimentálních případů zapojení GPT-4 V jako agenta do vývoje špičkových AAA her.

Nemusíme příliš tlačit na rychlost spojení s decentralizací, rád bych, aby agent nejprve vyplnil skládačku schopností a rychlosti zdola nahoru. Můžeme mít tolik narativních ruin a prázdných metaversů, které potřebují vyplnit, a v pravý čas zvážíme, jak z něj udělat další UNI.

Referenční materiály

Myšlenkový řetězec, který „vzejde“ z velkého modelu, co to vlastně je za schopnost? Autor: Brain Extreme

Jednoduchý pohled na agenta, další zastávka velkého modelu. Autor: LinguaMind