感動的:

2024 年 5 月 14 日の早朝、OpenAI は初の「春の新製品発表会」を開催し、新しい主力製品である GPT-4o 世代モデルとデスクトップ アプリを発表し、いくつかの新機能をデモンストレーションしました。

OpenAI のテクノロジーは私たちが慣れ親しんだ製品の形を変え、世界的なテクノロジー企業に重要なメッセージを伝えるものであるため、このカンファレンスは異例です。

他のテクノロジー企業が依然として大規模なモデルやマルチモーダル機能に追いつき、要約テキスト、画像編集、その他の機能をモバイル アプリケーションに統合しようとしている一方で、OpenAI は技術革命の大きな波を直接引き起こしました。まるでSF映画から抜け出してきたような商品が発売され、ウルトラマンサムもびっくり!

テキストを入力してください: 👇

OpenAI テクニカル ディレクターの Mira Murati 氏は、次の 3 つの重要なことを述べています。

●まず彼女は、より多くの人が恩恵を受けることができるよう、OpenAI の将来の製品は無料使用を優先すると発表しました。

●第二に、この目標を達成するために、OpenAI はプログラムのデスクトップ バージョンと、これらのツールをより簡単かつ自然に使用できるように更新されたユーザー インターフェイス (UI) をリリースしました。

●最後に、Mira が GPT-4 を発表した後、OpenAI は GPT-4o と呼ばれる大型モデルの新バージョンを発表しました。この新しいモデルの特別な点は、非常に自然な方法でユーザーと対話し、GPT-4 に匹敵するインテリジェンスをすべての人に提供し、無料ユーザーでもこのレベルのサービスを享受できることです。

ChatGPT のこの更新後、大規模モデルはテキスト、音声、画像の任意の組み合わせを入力として受け取り、テキスト、音声、画像の任意の組み合わせの出力をリアルタイムで生成できるようになります。これが将来の対話方法です。

GPT-4o の 4 つのハイライト:

ハイライト 1: 現実的な対話 + 数学的解決策

GPT-4o の応答速度は非常に速く、平均はわずか 320 ミリ秒で、最速ではわずか 232 ミリ秒で質問に答えることができます。これは人間の会話とほぼ同じ速度です。これは、GPT-4o と会話するときに、すぐに応答が得られるまで長く待つ必要がないことを意味します。さらに、GPT-4o の応答速度が速くなった後、ユーザーとの対話はより自然になり、まるで本物の人とチャットしているようです。ロボットの口調を真似たり、就寝時の話を聞かせたり、歌うこともできます。

それだけでなく、GPT-4o は視覚化テクノロジーも向上させており、カメラを通じて数学の問題を段階的に解決することができます。これは、数学の学習がより楽しく、理解しやすくなることを意味します。

ハイライト 2: インテリジェントなコミュニケーションの新時代

今回、GPT-4oの音声技術は、応答速度や感情認識だけでなく、リアルタイム言語翻訳機能も向上しました。記者会見では、二人はそれぞれイタリア語と英語で話した。その後、GPT-4o は会話を相手の言語に迅速に翻訳することができ、その強力なオンザフライ翻訳機能を実証しました。

ハイライト 3: ユーザーの感情をインテリジェントにセンシングする新時代

以前は、GPT-3.5 や GPT-4 などのモデルは、音声からテキストへの変換、テキストの処理、そしてテキストから音声への変換を担当する 3 つの個別の部分から構築されていました。このプロセスは少し面倒で、この設計により GPT はトーンや感情などの詳細を正確にキャプチャできなくなります。

ただし、OpenAI は GPT-4o モデルに特別な調整を加えました。入力と出力の両方が同じニューラル ネットワークによって処理されるようになり、ユーザーの感情をより適切に感知できるようになりました。会話が途切れた場合でも、GPT-4o はすぐに再開して会話を続けることができます。

ハイライト 4: すべてのユーザーに無料

GPT-4o モデルはすべてのユーザーに無料で公開されますが、有料ユーザーの容量制限は 5 倍に増加します。 GPT-4o の今後のアルファ版には、ChatGPT Plus ユーザー向けの新しい音声モードが含まれます。以前は ChatGPT Plus ユーザーのみが利用できた「GPT ストア」は、現在は無料ですべてのユーザーが利用できるようになりました。さらに、Mac ユーザーは ChatGPT アプリのデスクトップ バージョンを使用できるようになり、Windows ユーザー向けのバージョンも今年リリースされる予定です。

これらのアップデートは、より多くの人が GPT-4o の強力な機能を楽しめることを意味し、無料でオープンな「GPT ストア」もユーザーにさらなる選択肢を提供します。

OpenAI の今後の予定について:

OpenAIは新モデルの紹介に加え、記者会見で事業戦略も明らかにした。

まず、新しいモデルのクエリコストは GPT-4 よりも 50% 低く、これは新しいモデルをすべてのユーザーに提供できることを意味すると述べています。これは、OpenAI が、より多くの人に料金を払って購読してもらうことよりも、多数のユーザーを引きつけることに重点を置いていることを示唆しています。

ユーザー数の多さは、数か月前からオンラインになっている GPT ストアにとって朗報です。 iOS ストアと同様に、OpenAI はクリエイター コミュニティと開発者が共同で GPT ストアの開発を推進できることを期待しています。

たとえば、一部の教授は GPT を使用してクラス用にカスタマイズされたコンテンツをデザインしたり、ポッドキャスターがリスナー向けに独占的な GPT コンテンツを作成したりする場合があります。もちろん、一部の技術者は、GPT-4o を活用した多くの便利なツールが将来スマートフォンに登場すると信じています。

Apple は現在、この点に関してサードパーティ パートナーを探しており、交渉パートナーには Google や OpenAI が含まれています。

OpenAI に最も必要なものは何ですか?デバイス側のアプリケーション権限とシステムレベルの権限を提供できるのは Apple だけです。

Apple が最も必要としているものは何ですか?最高の AI テクノロジーと最も適切な大規模言語モデルである GPT-4o が、間違いなく最良の候補です。

さらに、Apple は自社開発チップと閉鎖的なエコシステムにおいて独自の利点を持っています。これを書いている今、6 月 10 日に開催される Apple の WWDC カンファレンスが楽しみになり始めています。

終わり:

人工知能の分野では、あらゆる技術の進歩は人間の知能と機械の知能のより深い統合を表しています。 GPT-4oはOpenAIの最新フラッグシップモデルとして技術的に大きな進歩を遂げました。音声理解機能が追加され、ユーザー エクスペリエンスにさらに注意が払われ、対話がより自然で便利になります。

OpenAI は依然として多くの機会と課題に直面していますが、同社は確固たる信念と継続的なイノベーションを維持してきました。将来の人工知能の分野において、OpenAIは今後も主導的な役割を果たし、人類社会の進歩にさらに貢献していくでしょう。