Odaily Planet Daily poinformował, że wczesnym rankiem 15 maja czasu pekińskiego podczas przemówienia programowego na konferencji programistów Google I/O dyrektor generalny Google Sundar Pichai udostępnił dziesiątki połączonych produktów Google i AI, które można nazwać „przyjaznymi rodzinie” produkty”. Poziom „Bucket”, walka z OpenAI, w tym Gemini 1.5 Pro i Gemini 1.5 Flash obsługujące tekst o długości 2 milionów tokenów, wersja Google technologii Sora Veo, najsilniejszy model open source Gemma 2, AI Reviews obsługujące wyszukiwanie generatywne, i TPU szóstej generacji czekają. Jednak to, co przyciągnęło największą uwagę, to Project Astra, uniwersalny projekt asystenta, który naprawdę prowadzi do AGI, ogłoszony przez Demisa Hassabisa, dyrektora generalnego Google DeepMind i szefa Google AI, oraz Voice NotebookLM, który bezpośrednio porównuje GPT-4o. Podczas przemówienia programowego na konferencji Google opublikował niesamowitą demonstrację asystenta AI i tym razem przysięgał, że nie został on w żaden sposób sfałszowany ani zmieniony. Demis powiedział, że Projekt Astra to prototyp asystenta AI, na który czekał od dziesięcioleci i jest przyszłością powszechnej sztucznej inteligencji. Poinformowano, że Project Astra to multimodalny asystent AI działający w czasie rzeczywistym, który wchodzi w interakcję z otaczającym go światem, odbierając informacje, zapamiętując to, co widzi, przetwarzając te informacje i rozumiejąc szczegóły kontekstowe. Jego interakcja głosowa jest znacznie szybsza niż obecnie Formularz Asystenta Google jest bardziej naturalny, nie ma opóźnień ani opóźnień i może odpowiadać na pytania lub pomagać w prawie wszystkim. Z demonstracji Project Astra może bardzo szybko przetwarzać przychodzące informacje, poprzez ciągłe kodowanie klatek wideo i łączenie wideo i mowy w oś czasu zdarzeń, a następnie buforowanie informacji w celu przypomnienia. Google twierdzi, że niektóre z tych funkcji zostaną dodane do aplikacji Gemini i innych produktów jeszcze w tym roku. Oprócz Project Astra firma Google wprowadziła także szereg podserii produktów AI Agent ogólnego przeznaczenia opartych na Gemini, w tym NotebookLM dla dźwięku, Music AI Sandbox dla muzyki, Veo dla wideo i Imagen 3 dla obrazów, bezpośrednio porównując je z GPT-4o i GPT-4o wydane przez OpenAI. (Nośniki tytanowe)