Odaily Planet Daily сообщила, что ранним утром 15 мая по пекинскому времени на программной речи на конференции разработчиков Google I/O генеральный директор Google Сундар Пичаи выпустил десятки комбинированных продуктов Google и искусственного интеллекта, которые можно назвать «семейными». продукты». Уровень «ведра», борьба с OpenAI, включая Gemini 1.5 Pro и Gemini 1.5 Flash, которые поддерживают длинный текст длиной 2 миллиона токенов, версию Google технологии Sora Veo, самую мощную модель с открытым исходным кодом Gemma 2, обзоры AI, поддерживающие генеративный поиск, и ТПУ шестого поколения ждут. Но больше всего внимания привлек Project Astra, проект универсального помощника, который действительно ведет к AGI, анонсированный Демисом Хассабисом, генеральным директором Google DeepMind и главой Google AI, а также голосовой NotebookLM, который непосредственно сравнивает GPT-4o. Во время основного выступления на конференции компания Google представила потрясающую демонстрацию ИИ-помощника и на этот раз поклялась, что она не была каким-либо образом подделана или подделана. Демис заявил, что Project Astra — это прототип ИИ-помощника, которого он ждал десятилетия, и будущее общего ИИ. Сообщается, что Project Astra — это мультимодальный ИИ-помощник, работающий в режиме реального времени, который взаимодействует с окружающим миром, получая информацию, запоминая то, что видит, обрабатывая эту информацию и понимая контекстные детали. Его голосовое взаимодействие происходит намного быстрее, чем сейчас. Форма Google Assistant более естественна, без задержек и лагов, и может отвечать на вопросы или помогать вам делать практически все. Судя по демонстрации, Project Astra может очень быстро обрабатывать входящую информацию, непрерывно кодируя видеокадры и объединяя видео и речь в временную шкалу событий, а затем кэшируя информацию для последующего вызова. Google сообщает, что некоторые из этих функций будут добавлены в приложение Gemini и другие продукты позднее в этом году. В дополнение к Project Astra Google также запустила множество продуктов подсерии AI Agent общего назначения на базе Gemini, включая NotebookLM для аудио, Music AI Sandbox для музыки, Veo для видео и Imagen 3 для изображений, непосредственно сравнивая их с GPT-4o и GPT-4o выпущены OpenAI и Sora. (Титан Медиа)