中国に本拠を置くAI企業DeepSeekは、より良い推論と問題解決能力のためにDeepSeek-R1-Lite-Previewをローンチしました。Xでの投稿で発表され、このシステムはOpenAIのような業界リーダーに対抗するものとして位置づけられています。
解説者たちは、DeepSeekの透明性が皮肉であると考えています。西側の企業がこれらのギャップに対処していないからです。
DeepSeek AIの新しいローンチは、より良い数学ができる。
中国に本拠を置くAI企業DeepSeekは、DeepSeek-R1-Lite-Previewという新しいバージョンのAIシステムを導入しました。Xでの投稿で、新しいAIシステムが推論と問題解決能力を向上させたと述べています。
DeepSeekによれば、このプレビューは問題解決能力と推論能力を測定するAIME(アメリカ合衆国招待数学試験)やMATHのベンチマークで良好なパフォーマンスを示しています。このAIは複雑な数学的および論理的問題を処理する能力に優れているようで、OpenAIのChatGPTや特にOpenAI o1と競争する準備が整っているかもしれません。
今週、Mistral AIのLe Chatも新機能への無料アクセスを許可するためのアップデートを発表しました。これらのローンチは、他社の欠点を克服し、生成AI市場で激しい競争を生み出しているようです。
DeepSeekはChatGPTとは異なり、声に出して考えます。
DeepSeekは、そのAIがリアルタイムでステップバイステップの推論を示し、思考過程をより透明にすることができると言っています。一方、AI企業はオープンソースモデルとAPI開発者ツールを近日中にリリースするとも述べています。
AIおよびテクノロジーの解説者アンドリュー・カランによって引用された比較チャートによると、DeepSeek-R1-Lite-PreviewはAIME(52.5)やCodeforces(1450)などのパラメータで最高得点を達成し、OpenAI o1-previewやClaude 3.5 Sonnetなどの競合他社を上回っています。
それはMATH-500でリードしています(91.6)、高度な問題解決タスクでの高いパフォーマンスを示しています。しかし、OpenAI o1-previewのようなモデルに比べ、GPQA Diamond(58.5)とZebra Logic(56.6)では遅れをとっています。これらの数値は、一般知識と論理的推論セグメントに改善の余地があることを意味します。
o1プレビュー発表から2ヶ月後、そのChain-of-Thought推論が複製されました。Whaleは今や推論が可能です。DeepSeekは、DeepSeek-R1の公式バージョンが完全にオープンソースになると述べています。 https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— アンドリュー・カラン (@AndrewCurran_) 2024年11月20日
Cryptopolitanは偏りのないレビューのためにローンチの機能を試しました。まず、DeepSeekのチャットにはユーザーログインが必要です。「Deep Think」機能下のチャットは、1日に最大50メッセージの会話に制限されています。Deepseekは大声で考えていると言えますが、応答時間も推定しています。また、提示した数学問題を論理的な順序で解決しました。比較すると、ChatGPT 4oは解決にかかる時間が少なかったが、同じ解決のためのステップバイステップの推論を提示しませんでした。
DeepSeekが数学問題にどのように応答するかChatGPT-4oが数学問題にどのように応答するか
インフルエンサーのビラワル・シディフはo1を揶揄し、「OpenAIのo1モデルはそのChain-of-Thought推論を隠している一方、中国のDeepSeek-R1はユーザーに対して透明であるのは皮肉だ。逆であるべきではないか?」と述べました。
つまり、中国にはAIに関する包括的な枠組みがあります。2023年7月13日、中国の複数の当局、包括サイバー空間管理局(CAC)や教育省が生成AI技術の新しい規則を導入しました。これらの規則は、生成AI規制と呼ばれ、昨年の8月15日に正式に発効しました。
この規制の範囲は、アルゴリズムの使用、深層合成技術、すべての生成AI技術の使用、およびいくつかの他の技術活動を含むと報じられています。そして、その透明な推論アプローチ、競争ベンチマークでの強力なパフォーマンス、オープンソースツールのリリース計画により、DeepSeekは中国での生成AIの限界を押し広げ、世界的な競合他社の中でも先進的な立場を築いています。
Web3キャリアを立ち上げ、高額な暗号の仕事を90日以内に獲得するためのステップバイステップシステム。