GoogleがGemini 2.0 Flash AIモデルを発表、現在開発者にアクセス可能

テクノロジー企業Googleは、Geminiファミリーの最新AIモデルであるGemini 2.0の発売を発表し、実験版としてGemini 2.0 Flashを開始しました。
開発者に人気のあるGemini 1.5 Flashの成功を踏まえ、Gemini 2.0 Flashは高速な応答時間を維持しながらパフォーマンスを向上させます。特に、新モデルは主要なベンチマークで1.5 Proを倍の速度で上回ります。さらに、Gemini 2.0 Flashは、画像、動画、音声などのマルチモーダル入力や、AI生成画像とペアになったテキスト、操作可能な多言語テキスト読み上げ（TTS）音声などのマルチモーダル出力をサポートする拡張機能を導入しました。このAIモデルは、Google検索の呼び出し、コードの実行、およびユーザー定義のサードパーティ機能へのアクセスもネイティブで行うことができます。
現在、Google AI StudioおよびVertex AIのGemini APIを通じて開発者に利用可能な2.0 Flashの実験版は、テキスト出力を伴うマルチモーダル入力をサポートしています。テキスト読み上げやネイティブ画像生成のような高度な機能は、早期アクセスパートナーが利用でき、追加のモデルサイズとともに1月により広く利用可能になる予定です。
開発者が動的でインタラクティブなアプリケーションを作成するためのさらなるサポートとして、Googleは新しいマルチモーダルライブアプリケーションプログラミングインターフェース（API）を導入しています。このAPIは、リアルタイムの音声およびビデオストリーミング入力を許可し、複数のツールを統合して機能を組み合わせる能力を提供します。
本日より、世界中のユーザーは、デスクトップおよびモバイルウェブプラットフォームのモデルドロップダウンからGemini 2.0 Flashの実験的なチャット最適化バージョンを試すことができます。このモデルは、近い将来Geminiモバイルアプリケーションでも利用可能になります。
Googleは研究プロジェクトを通じてGemini 2.0 Flashの能力を探求しています
Gemini 2.0 Flashは、マルチモーダル推論、長文コンテキスト理解、複雑な指示処理、計画、合成関数呼び出し、ネイティブツールとのシームレスな統合を含む、ユーザーインタラクションを強化する高度な機能を導入しています。これらの機能は、改善されたレイテンシーと相まって、自律型AI体験の新しい世代の基盤を構築するために協力します。
現在、GoogleはAIエージェントが実世界のタスクで人々を支援できる方法を、プロトタイプを通じて生産性を向上させ、ワークフローを合理化することを目的に研究しています。例としては、ユニバーサルAIアシスタントの潜在能力に焦点を当てた研究イニシアティブである更新されたProject Astra、人間とエージェントのインタラクションを再構築する新しいProject Mariner、そして開発者をサポートするために作成されたAI駆動のコーディングアシスタントJulesがあります。これらのプロジェクトでGemini 2.0 Flashを活用することで、Googleはその能力を効果的に評価し、結果を向上させることができ、新しいモデルの膨大な可能性を浮き彫りにしました。
GoogleがGemini 2.0 Flash AIモデルを発表、現在開発者にアクセス可能になりましたという投稿がMetaverse Postに初めて掲載されました。