Google: Otevře 'novou éru agentů' prostřednictvím AI agentů poháněných Gemini 2.0

Autor: Stephen Katte, CoinTe; Překlad: Tchao Zhu, Zlato Finance
Výzkumná laboratoř umělé inteligence Googlu DeepMind uvedla, že její nejnovější model umělé inteligence Gemini 2.0 se stane základem pro budování pokročilejších AI agentů.
Generální ředitel společnosti Google DeepMind Demis Hassabis a technický ředitel Koray Kavukcuoglu v blogovém příspěvku ze 11. prosince uvedli, že AI agenti pohánění Gemini 2.0, kteří byli vydáni 11. prosince, dokážou chápat složité pokyny, plánovat, usuzovat, jednat napříč webovými stránkami a dokonce asistovat při vytváření strategií pro videohry.
Hassabis a Kavukcuoglu uvedli: "Praktické aplikace AI agentů jsou vzrušující výzkumnou oblastí plnou možností."
"Prozkoumáváme tuto novou oblast prostřednictvím řady prototypů, které mohou lidem pomoci dokončit úkoly a udělat věci správně."
Podle Hassabise a Kavukcuoglu existuje v současnosti několik experimentálních AI asistentů poháněných Gemini, přičemž každý projekt má různé funkce.
Jeden z projektů s názvem Deep Research dokáže vytvářet vícestupňové výzkumné plány prostřednictvím vyhledávání na internetu a poté generovat dlouhou zprávu o výsledcích výzkumu, čímž pomáhá uživatelům prozkoumávat složitá témata.
Projekt Astra je univerzální AI asistent zaměřený na každodenní úkoly, jako jsou doporučení a rady na základě pokynů uživatelů, například jak prát prádlo nebo více informací o památkách.
Projekt Mariner se zaměřuje na vytvoření AI agenta, který může ovládat váš prohlížeč Chrome, pohybovat kurzorem, klikat na tlačítka, vyplňovat formuláře a procházet web.
Podle Hassabise a Kavukcuoglu jsou tyto projekty "stále ve fázi raného vývoje", ale doufají, že po testování a dalším vývoji je učiní "široce použitelné v budoucích produktech."
"Je ještě příliš brzy, ale projekt Mariner ukazuje, že navigace v prohlížeči se technicky stala možnou, ačkoli v současnosti úkoly nedokončuje vždy přesně a pomalu, ale s časem se to rychle zlepší."
Mezitím je ve vývoji projekt Jules, který slouží jako asistent pro vývojáře, může být přímo integrován do pracovního postupu GitHub a pomáhat s úkoly jako kódování a plánování.
Hassabis a Kavukcuoglu uvedli, že také používají Gemini 2.0 k budování agentů pro videohry, kteří mohou v reálném čase poskytovat hráčům doporučení na další kroky a online vyhledávat 'bohaté herní znalosti'.
"Spolupracujeme s předními vývojáři her, jako je Supercell, abychom prozkoumali, jak tyto agenty fungují, a testovali jejich schopnost vysvětlit různé herní pravidla a výzvy, od strategických her po simulátory zemědělství," uvedli.
V listopadu generální ředitel cloudové softwarové společnosti Salesforce Marc Benioff uvedl, že budoucnost umělé inteligence spočívá v autonomních agentech, nikoli ve velkých jazykových modelech (LLM).
"Ve skutečnosti si myslím, že jsme nyní dosáhli limitu magisterského studia práva," uvedl v podkástu 'Budoucnost všeho' 23. listopadu (Wall Street Journal).
Nvidia se také zaměřuje na to, aby se umístila na čele trendů.
"Vidíme, že počet AI nativních společností stále roste. Samozřejmě, že začínáme vidět, že podniky skutečně přijímají agentní AI jako aktuální trend," uvedl generální ředitel Nvidia Jensen Huang na konferenčním hovoru k třetímu čtvrtletí v listopadu.
Kromě toho Hassabis a Kavukcuoglu uvedli, že tým experimentuje s robotickou technologií, která 'může pomáhat v reálném světě'. V současnosti jsou AI agenti Googlu vydáváni pouze testerům a vývojářům.
Google: Otevře 'novou éru agentů' prostřednictvím AI agentů poháněných Gemini 2.0

Prozkoumat více od tvůrce

Nejnovější zprávy