Vyhledávačový gigant Google ve středu uvedl svůj Gemini 2.0, experimentální model, který může sám používat webové stránky a je v podstatě modelem „pro všechno.“

Podle generálního ředitele Googlu Sundara Pichaiho, nejnovější model umožní uživatelům vytvářet nové AI agenty, kteří „nás přibližují k naší vizi univerzálního asistenta.“ Společnost popsala svůj model jako svůj nejvíce „schopný model, který byl dosud postaven pro agentický věk.“

Iniciativy přicházejí jako součást úsilí firmy v oblasti zvýšené konkurence v technologickém průmyslu proti jako Meta, Microsoft a Meta.

Google postupně zavádí model napříč produkty

Pichai také odhalil, že nejnovější model, s multimodálními schopnostmi, bude postupně zaváděn do jeho produktů včetně nativního výstupu obrazu a zvuku. Vyhledávačový gigant uvedl Gemini 1.0 v prosinci loňského roku, což Google označil jako první „nativně multimodální“ model, což naznačuje, že model mohl zpracovávat a reagovat na dotazy textu, videa, obrázků, zvuku a kódu.

Nejnovější verze představuje nejnovější snahy Googlu v čím dál více konkurenčním závodu v oblasti AI.

„Pokud bylo Gemini 1.0 o organizaci a porozumění informacím, Gemini 2.0 je o tom, aby bylo mnohem užitečnější.“

Pichai.

Gemini 2.0 přichází téměř 10 měsíců poté, co Google poprvé uvedl 1.5. Model je stále v experimentálním náhledu, podle Googlu, s pouze jednou verzí modelu, menší, nižší verze 2.0 Flash.

Generální ředitel Google DeepMind a vedoucí AI snah společnosti Demis Hassabis řekl, že to byl stále velký den pro technologického giganta.

„Je to stejně dobré, jako je současný Pro model. Takže si to můžete představit jako jednu celou úroveň lepší, za stejnou nákladovou efektivitu a výkonnost a rychlost. O tom jsme opravdu šťastní,“ vysvětlil Hassabis.

V současnosti mají pouze vývojáři a testeři jako první přístup k 2.0, zatímco ostatní uživatelé Gemini mají přístup k experimentálnímu modelu 2.0 Flash, který vychází z 1.5 Flash, který byl spuštěn jako nejrychlejší a nejefektivnější model.

Google oznámil řadu nových funkcí

Podle společnosti očekává, že přidá schopnosti reasoning nového modelu do funkce AI Overviews, která je nyní přístupná jedné miliardě uživatelů, podle Pichai. Naznačil, že se stává jednou z nejoblíbenějších vyhledávacích funkcí skupiny.

S tímto novým modelem Pichai dále zdůraznil, že AI Overviews nyní budou schopny řešit složité víceúrovňové dotazy, například matematické rovnice a multimodální otázky.

I když omezené testování nejnovějšího modelu začalo tento týden, funkce reasoning bude dostupná pro více uživatelů až začátkem příštího roku.

Podle Googlu, model reasoning běží na 6. generaci AI čipu Trillium, který se také stal dostupným pro zákazníky Google Cloud ve středu.

Ve svém blogovém příspěvku Google odhalil, že nový čip poskytuje 4x lepší výkon a je o 67 % energeticky účinnější než jeho předchůdce.

Začínáme naši éru Gemini 2.0 s Gemini 2.0 Flash, který překonává 1.5 Pro v klíčových benchmarkech při 2X rychlosti (viz graf níže). Jsem obzvlášť nadšený, abych viděl rychlý pokrok v programování, s více na cestě.

Vývojáři si mohou vyzkoušet experimentální verzi v AI… pic.twitter.com/iEAV8dzkaW

— Sundar Pichai (@sundarpichai) 11. prosince 2024

Generální ředitel Google také oznámil další funkce, jako je nová funkce Gemini známá jako Deep Research, která může fungovat jako výzkumný asistent pomocí pokročilého reasoning a dlouhých kontextových schopností. Tato nová funkce je dostupná v Gemini Advanced a je schopna sestavovat výzkumné zprávy jménem uživatele.

Hassabis řekl, že Gemini 2.0 připravuje základ pro skvělý rok 2025.

„Opravdu vidíme rok 2025 jako skutečný začátek éry založené na agentech.“

Hassabis.

To přichází poté, co společnost oznámila spuštění dalšího produktu, projektu Mariner, experimentálního nového rozšíření Chrome, které může doslova používat webový prohlížeč pro uživatele.

Navíc Google také oznámil, že Jules – agent vytvořený specificky k pomoci vývojářům najít a opravit špatný kód – a nový agent založený na Gemini 2.0, který může sledovat obrazovky uživatelů a pomoci jim lépe hrát videohry.

Podle Hassabise, herní agent, který nazývá „velikonočním vajíčkem“, naznačuje, že je skutečně multimodální.

Od nuly k Web3 Pro: Váš 90denní plán na zahájení kariéry