検索エンジンの巨人であるGoogleは水曜日に、ウェブサイトを自ら使用できる実験モデルGemini 2.0を発表しました。これは基本的に「すべてのためのモデル」です。
GoogleのCEOであるSundar Pichaiによれば、最新のモデルはユーザーが「私たちのユニバーサルアシスタントのビジョンに近づく」新しいAIエージェントを構築することを可能にします。同社はこのモデルを「エージェント時代のために構築された最も能力のあるモデル」と表現しています。
これらの取り組みは、Meta、Microsoft、Metaなどに対するテクノロジー業界の競争が激化している中での同社の努力の一環として行われています。
Googleはこのモデルを製品全体に展開します。
Pichaiは、マルチモーダル機能を持つ最新モデルが、ネイティブな画像と音声出力を含む製品全体に展開されることを明らかにしました。検索エンジンの巨人は昨年12月にGemini 1.0を立ち上げました。これは「ネイティブにマルチモーダル」モデルの最初のものであり、モデルがテキスト、ビデオ、画像、音声、コードの問い合わせに応答できることを示唆しています。
最新バージョンは、テクノロジー業界のますます競争が激化するAIレースにおけるGoogleの最新の努力を示しています。
「Gemini 1.0が情報の整理と理解に関するものであったのに対し、Gemini 2.0はそれをはるかに有用にすることに関するものです。」
Pichai。
Gemini 2.0は、Googleが最初に1.5を立ち上げてから約10ヶ月後に登場しました。このモデルは依然として実験プレビュー中で、モデルのバージョンは1つだけ、小型で低エンドの2.0 Flashがリリースされています。
Google DeepMindのCEOであり、同社のAI活動の責任者であるDemis Hassabisは、これは技術巨人にとって大きな日であると述べました。
「現在のProモデルと同じくらい優れています。したがって、同じコスト効率と性能効率と速度で、1つの全体のティアが向上したものと考えることができます。私たちはそれに非常に満足しています」とHassabisは説明しました。
現在、開発者とテスターのみが最初に2.0を取得し、他のGeminiユーザーは、最速かつ最もコスト効率の高いモデルとして立ち上げられた1.5 Flashを基にした2.0 Flashの実験モデルにアクセスできます。
Googleは新機能の一連を発表しました。
同社によると、Pichaiによれば、新しいモデルの推論機能は、現在10億人のユーザーがアクセスできるAIオーバービュー機能に追加される予定です。彼はそれがグループの最も人気のある検索機能の1つになりつつあると示しています。
この新しいモデルにより、PichaiはAIオーバービューが今後複雑な多段階のクエリ、たとえば数学の方程式やマルチモーダルな質問に取り組むことができるとさらに強調しました。
最新モデルの限定テストは今週始まりましたが、推論機能は来年初めにより多くのユーザーがアクセスできるようになります。
Googleによると、この推論モデルは検索エンジンの巨人の第6世代AIチップ、Trilliumで動作しており、これは水曜日にGoogle Cloudの顧客にも提供されました。
Googleはブログ投稿で、新しいチップが前のモデルよりも4倍の性能を提供し、67%エネルギー効率が向上していることを明らかにしました。
私たちは、Gemini 2.0の時代の始まりをGemini 2.0 Flashで開始します。これは1.5 Proを主要なベンチマークで2倍の速度で上回ります(下のチャートを参照)。私は特にコーディングの迅速な進展を見ることに興奮しています。もっと来る予定です。
開発者はAIの実験的なバージョンを試すことができます… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 2024年12月11日
GoogleのCEOは、Deep Researchとして知られる新しいGemini機能など、研究アシスタントとして機能することができる新しい機能を発表しました。この新しい機能はGemini Advancedで利用可能であり、ユーザーの代わりに研究報告書を作成することができます。
Hassabisは、Gemini 2.0が素晴らしい2025年の基盤を築いていると述べました。
「私たちは2025年をエージェントベースの時代の真の始まりと見ています。」
Hassabis。
これは、同社がユーザーが実際にウェブブラウザを使用できる実験的な新しいChrome拡張機能であるProject Marinerの立ち上げを発表したことに伴うものです。
さらに、Googleは開発者が悪いコードを見つけて修正するのを助けるために特別に作成されたエージェントJulesと、ユーザーの画面を見てビデオゲームをより良くプレイするのを助けることができる新しいGemini 2.0ベースのエージェントを発表しました。
Hassabisによれば、彼が「イースターエッグ」と呼ぶゲームエージェントは、それが本当にマルチモーダルであることを示しています。
ゼロからWeb3 Proへ: あなたの90日間のキャリア立ち上げプラン