Google は、最新かつ今後公開予定の消費者向け AI モデルを誤って漏洩した可能性があるが、市場では現在、これが本物なのか、それともこの検索エンジン大手による意図的な動きなのか疑問視されている。

このリークは、Jarvis として知られるプロジェクトの内部レビューに関連する、Chrome ウェブストアでの予期せぬリストを通じて発生しました。伝えられるところによると、Chrome 拡張機能として短期間利用可能だった Jarvis は、ユーザーがダウンロードできる状態でした。

Googleはすぐにこのモデルをストアから削除した

このプロジェクトは Chrome ウェブストアから急いで削除されましたが、このリストにはプロジェクトの概要とそれが実現できることが少しだけ掲載されていたと伝えられています。

ページのリストによると、Jarvis は「あなたに代わってウェブサーフィンをしてくれる便利な仲間」と説明されている。このため、プロジェクトの詳細はほとんどなく、提供されるサービスについての詳細もほとんどないにもかかわらず、潜在的なユーザーの間で会話が盛り上がっている。

しかし、漏洩した文書がGoogle Cloudプラットフォームから削除された後、Googleは自社の高度なAIであるJarvisの存在を認めた。

このリークは、別のテクノロジー企業である OpenAI が自社の o1 モデルをリークし、そのモデルが画像を分析できることを人々に知らせてからわずか数日後に起こった。o1 モデルは、Web 検索やデータ分析も実行できると宣伝されている。

Jarvis のリークは、一連のスクリーンショットを更新することで Claude がユーザーのコンピューターを制御できる、Anthropic の最新製品と非常によく似ていると言われている ChatGPT Search のリリースから 1 週間後にも発生しました。

The Information によると、Jarvis は一般公開される前に社内テストが行​​われる予定だったが、Google に近い情報筋によると、そのリークにより、一般公開されるまでにどれくらいの時間がかかるのかという噂が広まったという。

GoogleのJarvisが日常的なタスクをこなす

リークされた拡張機能はほとんどのユーザーにとって機能しなかったが、AI モデルは単純なアシスタントの改良版であるとの報告もある。Jarvis は、Web との自己対話を通じて、商品の購入、航空券の予約、情報の検索などができると宣伝されている。

フォームの入力に何度もイライラしている場合、Jarvis がユーザーに代わってそのすべてを実行し、ユーザーが Web サイトをクリックすることなく、AI がタスクを独自に実行します。Jarvis の目標は、プロセスに費やす時間を最小限に抑え、ユーザーがより生産的なことに集中できるようにすることです。

AI モデルはコンピューターを制御および操作できるため、真の人間アシスタントのように感じられるため、生成的な開発と言えます。また、この開発により、AI モデルは将来の AI テクノロジーの出発点となります。

この AI モデルは、事前にプログラムされた応答や基本的なタスクに依存する既存のすべてのモデルとは異なると言われています。Jarvis は、インターネットをリアルタイムで検索し、コマンドを即座に実行できます。

検索エンジンの結果をスクロールすることにイライラしている人にとっては、Jarvis は最適なツールです。Jarvis は、現在のデータを取得して従来の検索エンジンを回避できるためです。

Jarvis の開発と能力は、既存の AI モデルからのアップグレードであるため、より多用途でダイナミックなものになると報告されています。

JarvisとGoogleの同業他社との比較

Google Assistant と Bard は Google がすでに提供している AI ツールであり、基本的なタスクを実行し、既存のデータに基づいてタスクや質問への回答を提供することができます。

しかし、最新モデルの Jarvis を見ると、既存の機能を組み合わせてより正確で強力なものになるように改良することで、テクノロジーがまったく新しいレベルに到達しています。

強力な Gemini 言語モデルと Web ブラウジング機能を使用することで、Jarvis は生成 AI ツール業界の一流の人物になります。

Jarvis が既存のテクノロジーと異なる点は、事前にプログラムされた回答を使用するのではなく、インターネット上で実際のデータを収集し、リアルタイムのアシスタントとして機能して最新情報を提供することです。

Google の Gemini 2.0 言語モデルを搭載した Jarvis は、自然言語を理解し、ユーザー入力に基づいてタスクを実行できます。