Pokud AIGC otevřelo éru inteligentního generování obsahu, pak AI Agent má příležitost skutečně zužitkovat schopnosti AIGC.
AI Agent je jako konkrétnější všestranný zaměstnanec, kterému se říká primární forma robota s umělou inteligencí. Dokáže pozorovat okolní prostředí, rozhodovat se a jednat automaticky jako lidé.
Bill Gates jednou otevřeně řekl: "Ovládání agenta umělé inteligence je skutečným úspěchem. V té době již nebudete muset sami vyhledávat informace na internetu." Agenti. Generální ředitel Microsoftu Satya Nadella kdysi předpověděl, že AI Agent se stane hlavní metodou interakce mezi člověkem a počítačem, dokáže porozumět potřebám uživatelů a proaktivně poskytovat služby. Profesor Ng Enda také předpovídá, že v budoucím pracovním prostředí budou lidé a agenti AI těsněji spolupracovat na vytváření efektivních pracovních modelů a zvyšování efektivity.
AI Agent není jen produktem technologie, ale také jádrem budoucího způsobu života a práce.
To nám připomíná, že když Web3 a blockchain poprvé vzbudily širokou diskusi, lidé často používali slovo „narušení“ k popisu potenciálu této technologie. Když se podíváme zpět na několik posledních let, Web3 se postupně vyvinul z původního ERC-20 a důkazu nulových znalostí až po DeFi, DePIN, GameFi atd., které jsou integrovány s jinými oblastmi.
Pokud zkombinujeme Web3 a AI, dvě oblíbené digitální technologie, dojde k efektu 1+ 1>2? Může projekt Web3 AI se stále větším rozsahem financování přinést nová paradigmata případů použití do odvětví a vytvořit nové skutečné potřeby?
AI Agent: Nejideálnější inteligentní asistent pro lidstvo
Kde je představivost agenta AI? Na internetu se široce šíří odpověď s vysokým skóre: „Velký jazykový model může naprogramovat pouze chamtivého hada, ale AI Agent může naprogramovat celého krále slávy. Zní to přehnaně, ale není to přehnané.
Agent se v Číně obvykle překládá jako „inteligentní tělo“. Tento koncept navrhl Minsky, „otec umělé inteligence“, ve své knize „The Society of Thinking“ vydané v roce 1986. Minsky věřil, že určití jedinci ve společnosti mohou po vyjednávání přijít s řešením určitého problému jsou Agenti. Agenti jsou základním kamenem interakce mezi člověkem a počítačem po mnoho let, od asistenta Microsoftu pro úpravy Clippy až po automatické návrhy Google Docs Tyto rané formy agentů ukázaly potenciál pro personalizovanou interakci, ale jejich schopnost zvládat složitější úkoly je stále omezená . Skutečný potenciál agentů mohl být využit až se vznikem velkých jazykových modelů (LLM).
V květnu tohoto roku se profesor Andrew Ng, autoritativní učenec v oboru AI, podělil o projev o AI Agent na akci Sequoia AI ve Spojených státech. V něm ukázal řadu experimentů, které provedl jeho tým:
Nechte AI napsat nějaký kód a spustit jej a porovnat výsledky z různých LLM a pracovních postupů. Výsledek je následující:
Model GPT-3.5: přesnost 48 %
Model GPT-4: přesnost 67 %
GPT-3.5 + Agent: vyšší výkon než model GPT-4
GPT-4 + Agent: mnohem vyšší než model GPT-4, velmi dobrý
opravdu. Když většina lidí používá LLM, jako je ChatGPT, obvykle zadají rychlé slovo a velký model okamžitě vygeneruje odpověď bez automatické identifikace a opravy chyb, mazání a přepisování.
Ve srovnání s tím pracovní postup AI Agent vypadá takto:
Nejprve nechte LLM napsat osnovu článku, pokud je to nutné, nejprve prohledejte obsah na internetu pro výzkum a analýzu, vytiskněte první návrh a poté si přečtěte návrh a přemýšlejte o tom, jak jej optimalizovat. a nakonec vytvoří logický a přesný článek Vysoce kvalitní články s nejnižší chybovostí.
Můžeme zjistit, že rozdíl mezi AI Agent a LLM je ten, že interakce mezi LLM a lidmi je založena na pohotových slovech (výzvách). AI Agent potřebuje pouze stanovit cíl a může samostatně myslet a jednat podle cíle. Podrobně rozeberte každý krok plánu na základě zadaného úkolu a spolehněte se na zpětnou vazbu z vnějšího světa a nezávislé myšlení, abyste si sami vytvořili podněty k dosažení svých cílů.
Proto OpenAI definuje AI Agenta jako: systém řízený LLM jako mozek, se schopností autonomně porozumět vnímání, plánování, paměti a používání nástrojů a může automaticky provádět složité úkoly.
Když se AI změní z používaného nástroje na subjekt, který může nástroj používat, stane se z něj agent AI. To je důvod, proč se AI Agent může stát tím nejideálnějším inteligentním pomocníkem pro lidstvo. AI Agent může například porozumět a zapamatovat si zájmy, preference a každodenní zvyky uživatele na základě historických online interakcí uživatele, identifikovat záměry uživatele, proaktivně předkládat návrhy a koordinovat více aplikací za účelem dokončení úkolů.
Stejně jako v Gatesově vizi již v budoucnu nebudeme muset přecházet na různé aplikace pro různé úkoly. Stačí, abychom počítačům a mobilním telefonům sdělili, co chceme dělat pro sdílení poskytne AI Agent personalizovanou odpověď.
Jednorožci se stávají realitou
AI Agent může také pomoci podnikům vytvořit nový inteligentní provozní model s jádrem „spolupráce člověk-stroj“. Stále více obchodních aktivit bude dokončeno AI, zatímco lidé se musí soustředit pouze na firemní vizi, strategii a kritická rozhodnutí o cestě.
Stejně jako generální ředitel OpenAI Sam Altman jednou v rozhovoru zmínil takovou přesvědčivou pointu, s rozvojem AI se chystáme vstoupit do éry „jednorožců s jednou osobou“, tedy společností založených jediným člověkem a dosahujících 1 mld. Společnost je oceněna v amerických dolarech.
Zní to jako fantazie, ale s pomocí AI Agents se tento nápad stává skutečností.
Řekněme, že chceme spustit technologický startup. Podle tradičního přístupu bych samozřejmě potřeboval najmout softwarové inženýry, produktové manažery, designéry, obchodníky, obchodníky a finance, kteří by všichni dělali své věci, ale byli koordinováni mnou.
Takže co když používám AI Agent, možná ani nebudu muset najímat zaměstnance.
Devin — Automatizační programování
Místo softwarového inženýra bych mohl použít Devina, softwarového inženýra AI, který letos explodoval, což mi může pomoci dokončit veškerou front-end a back-end práci.
Devin byl vyvinut společností Cognition Labs a je označován za „prvního světového softwarového inženýra AI“. Může samostatně dokončit celou práci na vývoji softwaru, analyzovat problémy, rozhodovat se, psát kód a opravovat chyby nezávisle, což vše lze provádět nezávisle. To výrazně snižuje zátěž vývojářů. Devin získal za pouhých šest měsíců financování ve výši 196 milionů dolarů a jeho ocenění rychle vyletělo na miliardy dolarů. Mezi investory patří známé společnosti rizikového kapitálu jako Founders Fund a Khosla Ventures.
Přestože Devin stále nespustil veřejnou verzi, můžeme nahlédnout do potenciálu Cursoru, dalšího nedávno oblíbeného produktu Web2. Udělá téměř všechnu práci za vás, během několika minut přemění jednoduchý nápad na funkční kód. Stačí zadat příkaz a „sednout si a užít si výsledky“. Existují zprávy, že osmileté dítě bez jakýchkoli zkušeností s programováním ve skutečnosti použilo Cursor k dokončení kódovací práce a vytvoření webu.
Hebbia — zpracování souborů
Místo produktového manažera nebo finančního člověka bych asi zvolil Hebbii, která za mě dělá veškeré třídění a analýzy dokumentů.
Na rozdíl od společnosti Glean, která se zaměřuje na vyhledávání dokumentů v rámci podniku, je Hebbia Matrix platformou AI Agent na podnikové úrovni, která využívá více modelů AI, které uživatelům pomáhají efektivně extrahovat, strukturovat a analyzovat data a dokumenty, čímž podporuje zvýšení podnikové produktivity. . Je působivé, kolik milionů dokumentů Matrix zvládne najednou.
Hebbia dokončila v červenci tohoto roku kolo série B v hodnotě 130 milionů dolarů, vedené a16z, za účasti známých investorů, jako jsou Google Ventures a Peter Thiel.
Jasper AI — generování obsahu
Místo operací na sociálních sítích a návrhářů bych si možná vybral Jasper AI, která mi může pomoci generovat obsah.
Jasper AI je asistent psaní AI Agent navržený tak, aby pomohl tvůrcům, obchodníkům a firmám zefektivnit proces generování obsahu a zvýšit produktivitu a kreativní efektivitu. Jasper AI dokáže generovat mnoho typů obsahu na základě stylu požadovaného uživatelem, včetně blogových příspěvků, příspěvků na sociálních sítích, reklamních textů, popisů produktů a dalších. A generovat obrázky na základě uživatelských popisů, které poskytují vizuální pomůcky pro textový obsah.
Jasper AI získala finanční prostředky ve výši 125 milionů dolarů a v roce 2022 dosáhla ocenění 1,5 miliardy dolarů. Podle statistik pomohla Jasper AI uživatelům vygenerovat více než 500 milionů slov, což z ní dělá jeden z nejpoužívanějších nástrojů pro psaní AI.
MultiOn — Automatizace webových stránek
Namísto asistenta bych si mohl vybrat MultiOn, který mi pomůže spravovat každodenní úkoly, zařizovat plány, nastavovat připomenutí a dokonce plánovat služební cesty, automaticky rezervovat hotely a automaticky zařizovat online jízdu.
MultiOn je automatizovaný síťový agent umělé inteligence, který může pomoci provádět úkoly autonomně v jakémkoli digitálním prostředí, například pomáhat uživatelům dokončit osobní úkoly, jako je online nakupování a sjednávání schůzek pro zlepšení osobní efektivity, nebo pomáhat uživatelům zjednodušit každodenní úkoly a zlepšit efektivitu práce.
Perplexity — hledání, výzkum
Místo badatele bych asi zvolil Perplexity, které CEO Nvidie používá každý den.
Perplexity je vyhledávač AI, který rozumí uživatelským otázkám, rozděluje je, poté prohledává a agreguje obsah a generuje zprávy, které uživatelům poskytují jasné odpovědi.
Zmatenost je vhodná pro různé skupiny uživatelů. Například studenti a výzkumní pracovníci mohou zjednodušit proces vyhledávání informací při psaní a zlepšit efektivitu marketingu.
Výše uvedený obsah je jen představivost Skutečné schopnosti a úrovně těchto agentů umělé inteligence zatím nestačí k tomu, aby nahradily elitní talenty ve všech oblastech života. Jak řekl Li Bojie, spoluzakladatel Logenic AI, současné možnosti LLM jsou pouze na základní úrovni a zdaleka nejsou na úrovni expertů. Současný agent AI je spíše jako zaměstnanec, který pracuje rychle, ale není příliš spolehlivý.
Nicméně se svými specializacemi tito agenti AI pomáhají stávajícím uživatelům zlepšit efektivitu a pohodlí v různých scénářích.
Nejen technologické společnosti, ale všechny společenské vrstvy mohou těžit z vlny agentů umělé inteligence. V oblasti vzdělávání může AI Agent poskytovat personalizované výukové zdroje a doučování založené na studijním pokroku, zájmech a schopnostech studentů v oblasti financí, AI Agent může uživatelům pomoci spravovat osobní finance, poskytovat investiční poradenství a dokonce předpovídat trendy akcií v oblasti lékařství může AI Agent pomáhat lékařům diagnostikovat nemoci a formulovat léčebné plány v oblasti e-commerce, AI Agent může také sloužit jako inteligentní zákaznická služba, která automaticky odpovídá na dotazy uživatelů, řeší problémy s objednávkami a požadavky na vrácení prostřednictvím přirozeného jazyka; technologie zpracování a strojového učení.
Multi-Agent: Další krok pro AI agenty
V předchozí části představy o jednorožčí společnosti s jednou osobou se jeden AI agent potýká s omezeními při zpracovávání složitých úkolů a je obtížné splnit skutečné potřeby. Při použití více agentů AI, protože tito agenti AI jsou založeni na heterogenním LLM, je kolektivní rozhodování obtížné a jejich schopnosti jsou omezené, takže se vyžaduje, aby lidé fungovali jako plánovači mezi těmito nezávislými agenty AI, aby koordinovali tyto agenty AI obsluhující různé aplikační scénáře. Jděte do práce. To vedlo ke vzniku „Multi Agent (multi-agent framework)“.
Složité problémy často vyžadují integraci více aspektů znalostí a dovedností a jediný AI agent má omezené schopnosti a je obtížné ho zvládnout. Organickým kombinováním AI agentů s různými schopnostmi umožňuje systém Multi-Agent agentům AI využít jejich příslušných silných stránek a učit se ze silných stránek ostatních, aby mohli efektivněji řešit složité problémy.
To je velmi podobné našemu skutečnému pracovnímu procesu nebo organizační struktuře: vedoucí zadává úkoly a lidé s různými schopnostmi jsou zodpovědní za různé úkoly. Výsledky každého procesu jsou předány dalšímu procesu a nakonec jsou získány konečné výsledky úkolu. .
V procesu implementace provádějí Agenti AI nižší úrovně své příslušné úkoly, zatímco Agenti AI vyšší úrovně přidělují úkoly a dohlížejí na jejich dokončení.
Multi-Agent může také simulovat náš lidský rozhodovací proces Stejně jako když narazíme na problémy, i my můžeme požádat o radu ostatní agenty AI a mohou nám poskytnout lepší informační podporu. Například AutoGen vyvinutý společností Microsoft splňuje tento požadavek:
Schopnost vytvářet AI agenty s různými rolemi. Tito agenti AI mají základní konverzační schopnosti a mohou generovat odpovědi na základě přijatých zpráv.
Použijte GroupChat k vytvoření prostředí skupinového chatu zahrnujícího více agentů AI V tomto GroupChatu agent AI s rolí správce spravuje záznamy chatu, pořadí řečníků, ukončení řeči atd. jiných agentů AI.
Pokud se použijeme na myšlenku jednorožčí společnosti, můžeme vytvořit několik AI agentů s různými rolemi prostřednictvím architektury Multi-Agent, jako jsou projektoví manažeři, programátoři nebo supervizoři. Řekněte jim naše cíle a nechte je přijít na to, jak to udělat. Stačí, když budeme mít pocit, že máme nějaké námitky, nebo když udělají něco špatně, ať to změní, dokud nebudeme spokojeni.
Ve srovnání s jedním agentem AI může Multi-Agent dosáhnout:
Škálovatelnost: Zvládněte problémy většího rozsahu zvýšením počtu agentů AI, z nichž každý zvládne část úkolu, což umožňuje systému škálovat podle rostoucí poptávky.
Paralelnost: Přirozeně podporuje paralelní zpracování, více agentů AI může pracovat na různých částech problému současně, čímž se urychluje řešení problémů.
Zlepšení rozhodování: Vylepšete rozhodování díky agregaci poznatků od více agentů AI, z nichž každý má svůj vlastní pohled a odborné znalosti.
Vzhledem k tomu, že technologie umělé inteligence pokračuje vpřed, je možné, že rámec pro více agentů bude hrát větší roli ve více odvětvích a bude podporovat vývoj různých nových řešení založených na umělé inteligenci.
Vítr AI Agent fouká směrem k Web3
AI Agent a Multi-Agent, když vystoupí z laboratoře, mají před sebou dlouhou cestu.
Bez ohledu na Multi-Agent má i ten nejpokročilejší jediný AI Agent v současnosti jasný horní limit na výpočetní zdroje a výpočetní výkon, který vyžaduje na fyzické úrovni, a nelze jej donekonečna rozšiřovat. Jakmile bude AI Agent čelit extrémně složitým a výpočetně náročným úkolům, nepochybně narazí na problémové místo výpočetního výkonu a jeho výkon se výrazně sníží.
Systémy AI Agent a Multi-Agent jsou navíc v podstatě modelem centralizované architektury, který určuje, že mají velmi vysoké riziko jediného selhání. Ještě důležitější je, že monopolní obchodní modely OpenAI, Microsoftu, Google a dalších společností založené na velkých modelech s uzavřeným zdrojem vážně ohrožují prostředí přežití nezávislých a samostatných začínajících agentů AI, takže agenti AI nemohou úspěšně využívat obrovská firemní soukromá data k aby byly chytřejší a efektivnější. Existuje naléhavá potřeba demokratického prostředí pro spolupráci mezi agenty AI, aby skutečně hodnotní agenti AI mohli sloužit širšímu okruhu lidí s potřebami a vytvářet větší hodnotu pro společnost.
A konečně, ačkoli je AI Agent blíže odvětví než LLM, jeho vývoj je založen na LLM. Současné velké modelové kolejiště se však vyznačuje vysokým technickým prahem, vysokými kapitálovými investicemi a nezralými obchodními modely je obvykle obtížné Financování pokračovat v aktualizaci a iteraci.
Paradigma Multi-Agent je pro Web3 skvělým úhlem, který pomáhá AI Mnoho vývojových týmů Web3 již investuje do výzkumu a vývoje, aby v těchto oblastech poskytovaly řešení.
Systémy AI Agent a Multi-Agent často vyžadují velké množství výpočetních zdrojů k provádění složitých úloh rozhodování a zpracování. Web3 dokáže vybudovat decentralizovaný trh s výpočetní energií prostřednictvím blockchainu a decentralizované technologie, takže zdroje výpočetní energie mohou být distribuovány a využívány spravedlivěji a efektivněji v globálním měřítku. Projekty Web3, jako jsou Akash, Nosana, Aethir a IO.net, mohou poskytnout výpočetní výkon pro rozhodování a uvažování agentů AI.
Tradiční systémy umělé inteligence jsou často spravovány centralizovaným způsobem, což způsobuje, že agenti umělé inteligence se potýkají s jednotlivými body selhání a problémům s ochranou dat. Díky decentralizované povaze Web3 je systém více agentů decentralizovaný a autonomní Na uzlu jsou požadavky kladené uživateli prováděny autonomně, což zvyšuje robustnost a bezpečnost. Zavedení mechanismů pobídek a trestů pro ručitele a delegáty prostřednictvím PoS, DPoS a dalších mechanismů může podpořit demokratizaci systémů jediného agenta AI nebo více agentů.
V tomto ohledu mají GaiaNet, Theoriq, PIN AI a HajimeAI všechny velmi špičkové pokusy.
Theoriq je projekt sloužící „AI pro Web3“ a doufá, že vytvoří volací a ekonomický systém pro AI agenty prostřednictvím Agentic Protocol, popularizuje vývoj Web3 a mnoha funkčních scénářů a poskytne ověřitelné možnosti modelového uvažování pro Web3 dApps.
GaiaNet je prostředí pro vytváření a nasazení agentů AI založené na uzlech, jehož výchozím bodem je ochrana duševního vlastnictví a soukromí dat odborníků a uživatelů, aby mohl konkurovat centralizovanému obchodu OpenAI GPT Store.
HajimeAI staví na těchto dvou, aby vytvořil pracovní postupy AI Agent založené na skutečných potřebách a inteligenoval a automatizoval samotný záměr, což odpovídá „personalizaci inteligence AI“, kterou zmiňuje PIN AI.
Modulus Labs a ORA Protocol zároveň pokročily ve směru algoritmu zkML a opML agenta AI.
A konečně, vývoj a iterace systémů AI Agent a Multi-Agent často vyžaduje velké množství finanční podpory a Web3 může pomoci potenciálním projektům AI Agent získat cennou včasnou podporu díky funkci likvidity s předstihem.
Spectral i HajimeAI navrhly koncepty produktů, které podporují vydávání aktiv AI Agent v řetězci: vydáním tokenů prostřednictvím IAO (Initial Agent Offering) mohou AI Agenti přímo získávat finanční prostředky od investorů a zároveň se stát členem DAO. řízení, které investorům poskytuje příležitost podílet se na vývoji projektu a podílet se na budoucích ziscích. Mezi nimi Benchmark DAO společnosti HajimeAI doufá, že organicky zkombinuje decentralizované hodnocení AI Agent a vydávání aktiv AI Agent prostřednictvím crowdfundingu a tokenových pobídek k vytvoření uzavřené smyčky AI Agenta spoléhajícího na Web3 financování a studený start, což je také relativně nový pokus.
AI Pandořina skříňka byla otevřena a všichni v ní jsou nadšení i zmatení, nikdo neví, zda je šílenství příležitostí nebo skrytým nebezpečím. Dnes již všechny oblasti života nejsou v éře financování PPT Bez ohledu na to, jak špičková je technologie, hodnotu lze realizovat pouze tehdy, když je implementována. Budoucnost AI Agent je předurčena k dlouhému maratonu a Web3 zajišťuje, že v tomto závodě nezmizí.