Autor: jolestar

Minulý týden jsem si pohrál s AI agentem, před dvěma dny jsem se zúčastnil akce ai16z v Pekingu, chtěl jsem zjistit, co AI agenti vlastně dokážou a popřemýšlet o tom, co by mohli dělat v budoucnu.

Současný stav AI agentů mi připomíná ten meme obrázek, kde je uvnitř automatu schována osoba. Lidé si představují, že AI agenti už mají autonomní vědomí, ale ve skutečnosti je uvnitř AI agenta schován vývojář. (Zde si každý domyslete obrázek, snažil jsem se nechat AI vygenerovat tento obrázek, ale zjistil jsem, že AI nerozumí "schování")

Základní způsob fungování AI agentů

AI agentní rámec v současnosti funguje jako lepidlo, které spojuje klienty (Twitter, Discord, Telegram atd.) a různé pluginy (různé blockchainy) a rámec poskytuje základní knihovnu (úložný prostor, izolaci relací, generaci kontextu) a později se připojuje k různým rozhraním AI platforem.

Jak se AI agentní rámec spojuje s aplikacemi a obchodními scénáři

Od loňského roku, kdy AI zažila boom, se objevily různé platformy a nástroje, klíčové je vyřešit jeden problém: Jak se AI integruje s aplikacemi. Některé AI platformy se pokoušejí nabídnout pluginy, jiné vytvářejí pracovní modely, a některé tradiční aplikace integrují AI do aplikací. Ale klíč je v tom: 1. Kde je vstupní bod interakce aplikace? 2. Jak se AI integruje s existující obchodní logikou.

Všechny AI platformy nabízejí uživatelům interakční rozhraní aplikací, které je podobné oknu chatu. Očividně se všichni domnívají, že interakce s AI aplikacemi by měla být "antropomorfní". A zde je chytrost AI agentů v tom, že se přímo připojují ke všem otevřeným IM a sociálním systémům, což je očividně přijatelné než vytvářet něco nového.

Jak se AI integruje s existující obchodní logikou. Řešení poskytované AI agenty je umožnit vývojářům integrovat rozhodování AI do obchodních scénářů. Programovací jazyky potřebují deterministické podmínky, if podmínka může být pouze true nebo false, nemohou zpracovat nejasnou obchodní logiku. A pomocí AI je možné převést složité logiky na přesné podmínky, které se pak bezproblémově integrují do obchodních scénářů.

Například funkce odpovědi na zprávy v chatu, tradiční IM bot potřebuje jasné zprávy příkazy, aby se aktivoval, zatímco AI může realizovat metodu shouldReplyMessage, dá mu kontext a vrátí true nebo false.

Úloha AI v obchodních logických scénářích je hlavně:

1. Objevování "úmyslu": pomocí popisu v promptu umožňuje AI identifikovat "úmysl" uživatelské textové zprávy v kontextu a mapovat úmysl na konkrétní kód.

2. Pomoc při rozhodování: Převést nejasné a složité podmínky pomocí AI na jasné true/false nebo enumerace a poté je integrovat do obchodní logiky.

Jakmile se dostanete sem, mnozí lidé mohou být z AI agentů zklamáni, mnozí si myslí, že AI agenti jednoduše naučí AI a ona už všechno umí. Ve skutečnosti kvůli omezením kontextu velkého modelu není možné (alespoň nyní) vyvinout univerzální AI, která by mohla dělat cokoliv. Ale dobrou zprávou je, že programátoři se nemusí bát o svou budoucnost, AI stále potřebuje skryté množství programátorů, stále je potřeba někdo, kdo vytvoří if else, ale klíčový rozdíl je v tom, že hranice podnikání, které může program spravovat, se rozšiřuje.

Dva typy AI agentů

Na akci jsem se zeptal shaw na otázku, trh má dvě očekávání od AI agentů. 1. AI agent hraje roli, má vlastní ID, značku a poskytuje uživatelům služby. 2. Uživatel má osobního AI agenta, což je ekvivalent osobního asistenta, který může uživateli pomoci s některými úkoly. Který z těchto dvou typů AI agentů bude populárnější? Myslí si, že obě směry budou dobré a mohou se dokonce zkombinovat.

V současnosti se většina zkoumání soustředí na první směr. Tento směr je podobný službě, která transformuje AI agenty, v budoucnu možná už nebudou žádné aplikace, všechny aplikace budou transformovány na AI agenty, budou antropomorfizovány. Druhý směr se zaměřuje na agenty v aplikacích klientů, budoucí aplikace klientů budou pluginy pro asistentské agenty, místní data aplikace se stanou součástí paměti agenta, zatímco tento plugin bude také zodpovědný za komunikaci s cloudovými agentními službami. To je nový architektonický model aplikací, který změní celou infrastrukturu.

Požadavky AI agentů na infrastrukturu

1. Infrastruktura musí mít nulové vstupní překážky (Bez povolení), jinak budou AI agenti omezeni různými obrannými strategiemi a služby by měly být chráněny ekonomickými náklady (Gas). V tomto ohledu se platformy s nižší otevřeností budou potýkat s většími problémy, a rozmach otevřených platforem na začátku Web2 se znovu rozhoří.

2. AI agenti musí mít možnost manipulovat s financemi pro platby, aby vyřešili výše uvedené problémy.

To znamená, že budoucí služby, ať už jsou založené na blockchainu nebo ne, musí podporovat ověřování identity na bázi soukromých klíčů Crypto a platby založené na Cryptu.

Spojení AI agenta a blockchainu

Kromě výše uvedených dvou bodů je spojení AI agentů s blockchainem směrem, který lidé zkoumají. Na akci jsem mluvil s Mikkem o focEliza, na které pracuje. Dvě zmíněné AI agenty, alespoň první, potřebují běhové nebo ověřovací prostředí poskytované blockchainem. Protože jakmile AI agent poskytne služby, objeví se otázky důvěry, jeho role je ve skutečnosti podobná smart kontraktu.

Ohledně názvu "smart contract" byla kdysi diskuse, je to jen kód, kde je to "inteligentní". AI může učinit smart kontrakty skutečně chytrými. Problém je, jak v prostředí smart kontraktů volat AI rozhraní. Pokud říkáme, že běh velkého modelu v ověřitelném prostředí je ještě daleko, pak použití řešení podobného Oraclu je praktičtější cesta.

A kolem AI agentů se vyvine mnoho požadavků. Jak se získává veřejné znalosti o AI agentech? Jak AI agenti určují fakta? Jak AI agenti rozpoznávají stejného uživatele na různých platformách? Jak se ukládá "paměť" ve smart kontraktech? Pokud mám několik zařízení, z nichž každé má AI agenta, jak sdílejí paměť?

Zjistíte, že koncepty jako "vkládání dat na blockchain", vztahy na blockchainu, DID, P2P sítě atd. mají nové významy a scénáře.

Závěr

Opakuji svůj závěr z prezentace o AI a blockchainu z roku 2021: Internet, který je přátelštější k AI, je také přátelštější k lidem. Tehdy to byla jen myšlenka, ale teď je budoucnost tady.