Google は、音声駆動型 AI チャットボット機能である Gemini Live をすべての Android ユーザーに無料で提供開始しました。この機能は、ユーザーが音声コマンドで Google の AI チャットボットに話しかけることを可能にするもので、以前は Gemini Advanced 加入者のみがフルに利用できました。
この新機能により、すべての Android ユーザーはチャットボットの対話機能を利用できるようになり、音声で質問したり、途中で回答を中断したりできるようになります。
この発表は、先月の Google Pixel 9 イベントで Gemini Live アプリケーションが初めてリリースされた後に行われた。Android ユーザーは、Gemini アプリケーション内の波形アイコンを押すことでこの機能を簡単に有効にでき、AI との音声対話を開始できる。このロールアウトは、Open AI の競合機能である ChatGPT の高度な音声モードがまだ完全にロールアウトされていない時期に行われた。
ユーザーはより詳細な制御でジェミニの音声モードにアクセスできるようになりました
Gemini Live の最も注目すべき機能には、ユーザーが声に出して質問したり、文の途中で応答を中断したり、AI の応答に異なる音声を選択したりできる機能があります。このハンズフリー機能により、ある程度の柔軟性とパーソナライゼーションが追加され、AI との会話がよりスムーズで応答性が高くなります。リアルタイムでディスカッションを管理することに加えて、参加者は必要に応じていつでも応答を「保留」したり、会話を「終了」したりすることもできます。
当初、音声制御機能は有料サービスの機能でしたが、この音声駆動機能は Gemini アプリケーションの無料バージョンで利用できるようになりました。Android ユーザーは、アプリまたはオーバーレイを使用してすぐにアクセスできます。現在、音声モードは英語のみをサポートするように最適化されていますが、Google は、正確なタイムラインは示されていないものの、より多くの言語を追加して iOS デバイスでもこの機能を利用できるようにする計画を確認しています。
OpenAIの音声機能が遅れをとる中、GoogleがGemini Liveをリリース
このリリースのタイミングにより、Google は 5 月に ChatGPT の高度な音声モードを発表した OpenAI より先に立つことになる。しかし、Open AI が提供するこの機能はまだ広く利用可能になっておらず、7 月下旬から限定的に利用可能になっている。他の業界関係者はさらに、特に大規模な音声ベースの AI 対話をサポートするには高い計算能力が必要であるため、待機期間が長くなっている可能性があると示唆している。
Google が Gemini Live を無料でリリースする動きは、OpenAI が同様の機能を段階的にリリースする動きとは対照的だ。OpenAI はより広範な採用に向けた戦略を練り続けているが、Google のリリースにより、タイピングではなく音声で AI と対話することに熱心なユーザーが Gemini Live を利用できるようになり、これが両社の競争上の優位性となる。
現在、Gemini Live は Android デバイスでアクセス可能であり、Google はサービスの開発に伴ってさらに多くの機能を追加する予定です。