Autor: jolestar
Minulý týden jsem se zabýval AI Agentem a před dvěma dny jsem se zúčastnil akce ai16z v Pekingu, abych zjistil, co AI Agent aktuálně skutečně umí, a přemýšlel o jeho budoucnosti.
Současný stav AI Agenta mi připomíná ten meme, kdy je uvnitř automatu skryta osoba. Lidé si již představují AI Agenta s autonomním vědomím, ale ve skutečnosti je uvnitř AI Agenta skrytý vývojář. (Tady si to každý představí, zkoušel jsem nechat AI vygenerovat obrázek, ale zjistil jsem, že AI nedokáže pochopit 'schovat').
Základní způsob fungování rámce AI Agent
Rámec AI Agenta aktuálně funguje jako lepidlo, které spojuje klienty (Twitter, Discord, Telegram atd.) a různé pluginy (různé blockchainy) a poté rámec poskytuje základní knihovnu (paměťové úložiště, izolaci konverzací, generaci kontextu) atd. pro napojení na různé AI platformy.
Jak se rámec AI Agenta kombinuje s aplikacemi a obchodními scénáři
Od loňského roku, kdy AI vzrostla na popularitě, se objevily různé platformy a nástroje. Klíčové je vyřešit problém, jak se AI kombinuje s aplikacemi. Některé AI platformy se pokoušejí nabídnout pluginy, jiné vytvářejí pracovní modely, a některé tradiční aplikace integrují AI do svých rozhraní. Klíčové otázky jsou: 1. Kde je interakční rozhraní aplikace? 2. Jak se AI kombinuje se stávající obchodní logikou.
Interakční rozhraní aplikací poskytovaných různými AI platformami je obdobou chatovacího okna. Je zřejmé, že všichni se shodují na tom, že interakce s AI aplikacemi by měla být „humánní“. Inteligence AI Agent spočívá v tom, že se připojuje přímo k všem otevřeným IM a sociálním systémům, což je zřejmě snáze přijatelné než vytvářet něco nového.
Jak se AI kombinuje se stávající obchodní logikou. Řešení nabízené AI Agentem spočívá v tom, že umožňuje vývojářům integrovat rozhodování AI do obchodních scénářů. Programovací jazyk vyžaduje determinističnost, podmínky if mohou být pouze true nebo false, a nemohou zpracovávat nejasnou obchodní logiku. Pomocí AI je možné převést složité logiky na přesné podmínky, které lze hladce integrovat do obchodních scénářů.
Například funkce odpovídání na zprávy v rámci skupiny; tradiční IM bot potřebuje k aktivaci určité explicitní zprávy, zatímco díky AI můžeme mít metodu shouldReplyMessage, která vrací true nebo false podle kontextu.
Hlavní úloha AI v obchodní logice je:
1. Objevování 'úmyslů': Pomocí popisů v podnětech umožnit AI odhalit 'úmysly' uživatelských textových zpráv na základě kontextu a mapovat je na konkrétní kód.
2. Asistence při rozhodování: Pomocí AI převést nejasné složité podmínky na určité true/false nebo enumerativní typy a poté je začlenit do obchodní logiky.
Mnoho lidí může být zklamáno AI Agentem, protože si myslí, že stačí naučit AI a ona bude umět všechno. Ve skutečnosti, kvůli problémům s kontextem velkých modelů, není možné (alespoň zatím) vytvořit univerzální AI, která by uměla cokoliv. Dobrou zprávou je, že programátoři se nemusí obávat o ztrátu zaměstnání; AI stále potřebuje velké množství programátorů a někoho, kdo bude vytvářet if else, ale klíčový rozdíl je, že hranice toho, co mohou programy zpracovat, se rozšiřuje.
Dva typy AI Agentů
Na akci jsem se Shawovi zeptal na otázku, jaké jsou dvě očekávání trhu od AI Agentů. 1. AI Agent má hrát roli, mít své ID, značku a poskytovat služby uživatelům. 2. Uživatel má osobního AI Agenta, což je osobní asistent, který mu pomáhá vyřizovat některé záležitosti. Který z těchto dvou typů AI Agentů bude populárnější? Myslí, že oba směry budou dobré a mohou se také spojit.
V současné době se většina lidí zaměřuje na první směr. Tento směr je podobný službě AI Agentizace; v budoucnu může být absence uživatelského rozhraní aplikací, všechno se stane AI Agentem, přejde k humanizaci. Druhý směr je agentizace aplikací klientů; budoucí aplikace klientů budou pluginy asistentů Agentů, místní data aplikace se stanou součástí paměti Agenta, zatímco tento plugin bude také zodpovědný za komunikaci s cloudovými službami Agentů. A to je nový architektonický model aplikací, který změní celou infrastrukturu.
Požadavky AI Agenta na infrastrukturu
1. Infrastruktura by měla mít nulové překážky pro přístup (Permissionless), jinak bude AI Agent omezován různými obrannými strategiemi. Služby by měly být chráněny ekonomickými náklady (Gas). V tomto ohledu platformy s nižší otevřeností čelí velkým výzvám; počáteční rozkvět otevřených platforem Web2 bude znovu oživen.
AI Agent potřebuje mít možnost operovat s financemi, aby mohl platit a tím řešit výše uvedený problém.
To znamená, že budoucí služby, ať už jsou založené na blockchainu či nikoli, budou muset podporovat identifikaci pomocí privátních klíčů Crypto a platby na bázi Crypto.
Kombinace AI Agenta a blockchainu
Kromě výše zmíněných dvou bodů, jak se AI Agent kombinuje s blockchainem, je směrem, kterým se lidé snaží vyvíjet. Na akci jsem mluvil s Mikkke o jeho projektu focEliza. Dva předtím zmíněné typy AI Agentů, alespoň ten první, potřebují provozní nebo validační prostředí, které poskytuje blockchain. Jakmile AI Agent začne poskytovat služby, objeví se problém s důvěrou; jeho role je vlastně stejná jako u chytrých kontraktů.
Existovala diskuse ohledně názvu 'chytrý kontrakt'; je to jen kód, kde je 'chytrý'? AI může učinit chytré kontrakty skutečně chytrými. Problém je, jak zavolat AI rozhraní v prostředí chytrých kontraktů. Pokud jde o provoz velkého modelu v ověřitelném prostředí, tato cesta je ještě daleko; použití řešení podobného Oracle je pragmatičtější přístup.
Kolem AI Agenta se vyvinou mnohé požadavky. Jak získat veřejné znalosti o AI Agentovi? Jak AI Agent určuje fakta? Jak AI Agent rozpoznává stejného uživatele na různých platformách? Jak se v chytrých kontraktech ukládá 'paměť'? Pokud mám více zařízení, z nichž každé má AI Agenta, jak sdílejí paměť?
Zjistíte, že pojmy jako „data na blockchainu“, vztahy na blockchainu, DID, P2P sítě atd., které byly zkoumány ve Web3, mají nyní nový smysl a kontext.
Závěr
Opakuji svůj závěr z přednášky o AI a blockchainu v roce 2021: internet přátelštější k AI je také internet přátelštější k lidem. Tehdy to byl jen nápad, ale nyní je budoucnost tady.