Odaily Planet Daily の報道によると、北京時間 5 月 15 日早朝、Google I/O 開発者会議の基調講演で、Google CEO のサンダー・ピチャイ氏が、Google と AI を組み合わせた「家族向け」と言える数十の製品を発表した「バケット」レベルでは、200万トークンの長文テキストをサポートするGemini 1.5 ProとGemini 1.5 Flash、Google版SoraテクノロジーVeo、最強のオープンソースモデルGemma 2、生成検索をサポートするAI Overviewsなど、OpenAIとの戦い、そして第6世代TPU待機。しかし、最も注目を集めているのは、Google DeepMind の CEO で Google AI の責任者である Demis Hassabis によって発表された、真に AGI につながるユニバーサル アシスタント プロジェクトである Project Astra と、GPT-4o を直接ベンチマークする Voice NotebookLM です。カンファレンスの基調講演で、Googleは非常に驚くべきAIアシスタントのデモンストレーションを公開したが、今回はいかなる形でも偽造や改ざんはされていないと誓った。デミス氏は、プロジェクト・アストラは何十年も待ち望んでいたAIアシスタントのプロトタイプであり、一般的なAIの未来であると述べた。 Project Astra は、情報を受信し、見たものを記憶し、その情報を処理し、状況の詳細を理解することで周囲の世界と対話するリアルタイムのマルチモーダル AI アシスタントであると報告されています。その音声対話は現在よりもはるかに高速です。 Google アシスタントはより自然で、遅延もなく、質問に答えたり、ほとんどすべての操作をサポートしたりできます。デモンストレーションからわかるように、Project Astra はビデオ フレームを継続的にエンコードし、ビデオと音声をイベントのタイムラインに結合し、呼び出すために情報をキャッシュすることで、受信した情報を非常に迅速に処理できます。 Googleによれば、これらの機能の一部は今年後半にGeminiアプリやその他の製品に追加される予定だという。 Project Astra に加えて、Google は Gemini をベースにしたさまざまな汎用 AI Agent サブシリーズ製品もリリースしました。これには、オーディオ用の NotebookLM、音楽用の Music AI Sandbox、ビデオ用の Veo、画像用の Imagen 3 が含まれます。 OpenAI と Sora によってリリースされた GPT-4o と GPT-4o。 (チタンメディア)