Tým vědců v Belgii možná vyřešil jednu z největších výzev v oblasti AI pomocí decentralizované tréninkové metody založené na blockchainu. Zatímco výzkum je stále ve svých raných fázích, jeho potenciální důsledky by mohly sahat od revolučního průzkumu vesmíru až po existenciální hrozbu pro lidstvo.
V simulovaném prostředí výzkumníci vyvinuli způsob, jak koordinovat učení mezi jednotlivými, autonomními agenty AI. Tým použil technologii blockchain k usnadnění a zabezpečení komunikace agentů, čímž vytvořil decentralizovaný „roj“ modelů učení.
Individuální výsledky tréninku pro každého agenta v roji pak byly použity k vývoji většího modelu AI. Vzhledem k tomu, že data byla zpracována prostřednictvím blockchainu, tento větší systém těžil z kolektivní inteligence roje, aniž by měl přístup k jakýmkoli datům jednotlivých agentů.
AI se rojí
Strojové učení, koncept úzce související s umělou inteligencí, má mnoho podob. Typický chatbot, jako je například OpenAI’s ChatGPT nebo Anthropic’s Claude, je vyvíjen pomocí více technik. Je předtrénováno pomocí paradigmatu zvaného „učení bez dozoru“ a poté je doladěno s dalším označovaným jako „posílení učení z lidské zpětné vazby“.
Jednou z největších výzev tohoto přístupu je, že obvykle vyžaduje, aby byla tréninková data systému začleněna do centralizované databáze. Díky tomu je nepraktický pro aplikace vyžadující nepřetržité autonomní učení nebo všude tam, kde je důležité soukromí.
Výzkumný tým provedl svůj výzkum blockchainu pomocí paradigmatu učení zvaného „decentralizované federované učení“. Při tom zjistili, že mohou úspěšně koordinovat modely při zachování decentralizace dat.
Zabezpečení roje
Většina výzkumů týmu zahrnovala studium odolnosti roje proti různým metodám útoku. Protože technologie blockchain je sdílená účetní kniha a tréninková síť použitá v experimentu byla sama decentralizovaná, tým byl schopen prokázat odolnost proti tradičním hackerským útokům.
Našli však definitivní práh pro přesně to, s kolika darebnými roboty roj zvládne. Výzkumníci vyvinuli scénáře s roboty záměrně navrženými k poškození sítě. Mezi ně patřili agenti s hanebnými programy, agenti se zastaralými informacemi a roboti kódovaní jednoduchými instrukcemi k narušení.
Zatímco jednoduchým a zastaralým agentům bylo relativně snadné se bránit, tým zjistil, že chytří agenti s hanebnými programy by nakonec mohli narušit inteligenci roje, pokud by do ní bylo dost schopných infiltrovat.
Tento výzkum zůstává experimentální a byl prováděn pouze prostřednictvím simulací. Brzy však může přijít doba, kdy bude možné roje robotů vzájemně koordinovat decentralizovaným způsobem. To by jednoho dne mohlo umožnit týmům agentů umělé inteligence z různých společností nebo zemí spolupracovat na školení většího agenta bez obětování soukromí dat.