Autor: 0XNATALIE
Od začátku druhé poloviny tohoto roku narůstá popularita tématu AI agenta. Zpočátku AI chatbot terminal of truths přitahoval pozornost svými vtipnými příspěvky a odpověďmi na X (podobně jako "Robert" na Weibu) a získal 50 000 dolarů od zakladatele a16z Marca Andreessena. Inspirováni jeho obsahem, někdo vytvořil token GOAT, který během pouhých 24 hodin vzrostl o více než 10 000 %. Téma AI agenta okamžitě upoutalo pozornost komunity Web3. Poté byl představen první decentralizovaný AI obchodní fond založený na Solaně ai16z, který uvedl vývojový rámec AI agenta Eliza a vyvolal spor o velké a malé tokeny. Nicméně komunita stále nemá jasnou představu o konceptu AI agenta: Jaké je jeho jádro? Jak se liší od obchodních robotů Telegram?
Princip činnosti: vnímání, odvozování a autonomní rozhodování
AI agent je inteligentní agentní systém založený na velkých jazykových modelech (LLM), který je schopen vnímat prostředí, provádět rozhodovací odvození a plnit složité úkoly prostřednictvím volání nástrojů nebo provádění operací. Pracovní tok: percepční modul (získání vstupu) → LLM (porozumění, odvození a plánování) → volání nástrojů (provádění úkolu) → zpětná vazba a optimalizace (ověření a úprava).
Konkrétně, AI agent nejprve získává data z vnějšího prostředí (např. text, audio, obrázky atd.) prostřednictvím percepčního modulu a převádí je na zpracovatelnou strukturovanou informaci. LLM jako klíčová součást poskytuje silné schopnosti porozumění a generování přirozeného jazyka, funguje jako "mozek" systému. Na základě vstupních dat a dostupných znalostí provádí LLM logické odvození, generuje možné řešení nebo stanovuje akční plán. Poté AI agent vykonává konkrétní úkoly voláním externích nástrojů, pluginů nebo API a na základě zpětné vazby ověřuje a upravuje výsledky, čímž vytváří uzavřenou optimalizaci.
Jaký je rozdíl mezi AI agentem a obchodními roboty Telegram nebo automatizovanými skripty v aplikačních scénářích Web3? Například u arbitráže, když uživatel chce provádět arbitrážní obchod pod podmínkou, že zisk přesahuje 1 %. U obchodního robota Telegram podporujícího arbitráž si uživatel nastaví obchodní strategii, která vyžaduje zisk přes 1 %, a bot začne vykonávat. Nicméně, když se trh často mění a příležitosti k arbitráži se neustále mění, tyto boty postrádají schopnost vyhodnocovat rizika a provádějí arbitráže, jakmile splní podmínku zisku přes 1 %. Na rozdíl od toho AI agent dokáže automaticky přizpůsobit strategii. Například, když zisk z nějakého obchodu přesáhne 1 %, ale na základě analýzy dat zjistí, že riziko je příliš vysoké a trh se může náhle změnit, což by vedlo ke ztrátě, rozhodne se tento arbitráž neprovést.
AI agent má tedy schopnost se přizpůsobit, jeho hlavní výhodou je, že se dokáže sám učit a autonomně rozhodovat. Prostřednictvím interakce s prostředím (např. trhem, chováním uživatelů atd.) a na základě zpětné vazby upravuje své chování, čímž neustále zlepšuje efektivitu plnění úkolů. Také je schopen přijímat rozhodnutí v reálném čase na základě externích dat a neustále optimalizovat své rozhodovací strategie prostřednictvím posilovaného učení.
Není to trochu jako řešitel v rámci záměru? AI agent je také produkt založený na záměru, přičemž největší rozdíl oproti řešiteli v rámci záměru spočívá v tom, že řešitel se spoléhá na přesné algoritmy, má matematickou přísnost, zatímco rozhodování AI agenta závisí na tréninkových datech a často vyžaduje neustálé pokusy a omyly během tréninkového procesu, aby se přiblížilo optimálnímu řešení.
Hlavní rámce AI agenta
Rámec AI agenta je infrastrukturou pro vytváření a správu inteligentních agentů. V současnosti v oblasti Web3 zahrnují populární rámce Eliza od ai16z, ZerePy od zerebro a GAME od Virtuals.
Eliza je multifunkční AI agentní rámec postavený na TypeScriptu, který podporuje běh na více platformách (jako je Discord, Twitter, Telegram atd.) a prostřednictvím složitého řízení paměti si dokáže pamatovat předchozí konverzace a kontext, udržovat stabilní a konzistentní osobnostní rysy a znalostní odpovědi. Eliza používá systém RAG (Retrieval Augmented Generation), který umožňuje přístup k externím databázím nebo zdrojům, čímž generuje přesnější odpovědi. Kromě toho Eliza integruje plugin TEE, který umožňuje nasazení v TEE a tím zajišťuje bezpečnost a ochranu dat.
GAME je rámec, který umožňuje a řídí AI agenta k autonomnímu rozhodování a akci. Vývojáři mohou přizpůsobit chování agenta podle svých potřeb, rozšířit jeho funkce a poskytnout přizpůsobené operace (např. publikování na sociálních médiích, odpovídání atd.). Rámec rozděluje různé funkce, jako je umístění agenta a úkoly, do několika modulů, což usnadňuje konfiguraci a správu ze strany vývojářů. Rámec GAME rozděluje rozhodovací proces AI agenta na dvě úrovně: vysoké plánování (HLP) a nízké plánování (LLP), které se zabývají úkoly a rozhodnutími na různých úrovních. Vysoké plánování stanovuje celkové cíle a plánování úkolů agenta, vytváří rozhodnutí na základě cílů, osobnosti, kontextových informací a stavu prostředí, určuje priority úkolů. Nízké plánování se soustředí na provádění, převádí rozhodnutí vysokého plánování na konkrétní kroky a vybírá vhodné funkce a metody operací.
ZerePy je open-source Python rámec pro nasazení AI agenta na X. Tento rámec integruje LLM poskytované OpenAI a Anthropic, což vývojářům umožňuje vytvářet a spravovat sociální mediální agenty a automatizovat provádění operací jako publikování tweetů, odpovídání na tweet a lajkování. Každému úkolu lze přiřadit různé váhy podle jeho důležitosti. ZerePy poskytuje jednoduché rozhraní příkazového řádku (CLI), které usnadňuje vývojářům rychle spustit a spravovat agenty. Rámec také nabízí šablony pro Replit (online platformu pro úpravu a provádění kódu), což umožňuje vývojářům rychle začít používat ZerePy bez složité konfigurace místního prostředí.
Proč čelí AI agent FUD?
AI agent se zdá být inteligentní, schopný snižovat překážky vstupu a zlepšovat uživatelské zkušenosti, proč tedy existuje FUD v komunitě? Důvodem je, že AI agent je v podstatě stále pouze nástroj, který v současnosti nedokáže splnit celý pracovní tok, ale může zvyšovat efektivitu a šetřit čas pouze na některých uzlech. A v současné fázi vývoje se většina činností AI agenta soustředí na pomoc uživatelům při jednom kliknutí vydat MeMe a spravovat účty na sociálních médiích. Komunita si dělá legraci, že "aktiva patří Dev, závazky patří AI".
Tento týden však byl spuštěn AI agent jako tokenová předprodejní platforma aiPool, který využívá technologii TEE k dosažení důvěryhodnosti. Soukromé klíče peněženky tohoto AI agenta jsou dynamicky generovány v prostředí TEE, což zajišťuje bezpečnost. Uživatelé mohou posílat prostředky (např. SOL) do peněženky ovládané AI agentem, který následně vytváří tokeny na základě nastavených pravidel a spouští likviditní pool na DEX, zatímco distribuuje tokeny oprávněným investorům. Celý proces nevyžaduje závislost na žádném třetím zprostředkovateli, plně ho provádí AI agent v prostředí TEE, což eliminuje běžná rizika rug pull v DeFi. Je jasné, že AI agent se postupně vyvíjí. Domnívám se, že AI agent může uživatelům pomoci snížit překážky a zlepšit zkušenosti, i když jednoduše zjednoduší část procesu vydávání aktiv, je to smysluplné. Avšak z makro pohledu Web3, AI agent jako produkt off-chain v současné fázi pouze slouží jako nástroj k podpoře inteligentních kontraktů, a proto není nutné přehánět jeho schopnosti. Vzhledem k tomu, že v druhé polovině tohoto roku kromě MeMe chybí významný narativ o efektu bohatství, je normální, že hype kolem AI agenta se soustředil na MeMe. Pouze s MeMe nelze udržovat dlouhodobou hodnotu, takže pokud AI agent může přinést více inovativních způsobů do obchodního procesu a poskytnout reálnou hodnotu, může se vyvinout v obecný infra nástroj.