アリババの最新AIモデルQwQ-32B-Previewは、一部のベンチマークでOpenAIのO1を凌駕

AI分野での競争が激化する中、中国の小売巨人アリババは、OpenAIのo1シリーズを凌駕するQwQ-32B-Previewを発表しました。
最新のモデルは、論理パズルや数学問題におけるAIモデルのパフォーマンスを評価するAIMEやMATHテストなどの特定のベンチマークでOpenAIのo1-previewやo1-miniモデルを凌駕するとのことです。
アリババはQwQ-32B-Previewをダウンロード用に公開しました。
小売の巨人であるアリババによると、新しいモデルは、ChatGPT-4やClaude 3.5のような通常の大規模言語モデル（LLM）と比べて、複雑で入り組んだ問題に対処できる能力を持っています。
Benzingaの記事によると、QwQ-32B-Previewは許可されたライセンスの下で利用可能な数少ないモデルの一つで、ユーザーがダウンロードして使用できるようになっています。このモデルは現在、AI開発プラットフォームHugging Faceで利用可能です。
しかし、アリババはモデルの完全な複製やその動作に対する洞察を制限するために、モデルの特定のコンポーネントを公開しました。
アリババの最新モデルは325億のパラメータを誇り、最大32,000ワードのプロンプトを処理することができます。このモデルの大きな能力と半オープンなアクセス性により、アリババの新しい参入者はAI推論技術の変革的な飛躍の舞台を整えています。
アリババの透明な発表は、そのモデルの洗練を強調していますが、OpenAIはそのパラメータ数を秘密にしています。
このモデルの登場は、OpenAIがAI分野で重要な進展を遂げている時期にあたります。10月には、OpenAIの評価額が成功した資金調達ラウンドを受けて1570億ドルに跳ね上がりました。
今週初め、ソフトバンクグループSFTBFは、ChatGPTの製造元への15億ドルの従業員株式買収を通じて持分を増やしたと報じられています。
OpenAIはまた、米国司法省からの圧力を受けて、Alphabetの子会社であるGoogle Chromeブラウザに挑戦するために自社のウェブブラウザの開発を模索しているとも言われています。
アリババはこのモデルにも欠陥があることを認めています
ユニークな強みを持っているものの、新しいモデルには限界もあります。グループによると、QwQ-32B-Previewには予期しない言語の切り替えなどの問題があり、これがユーザーを混乱させる可能性があります。また、このモデルは多くのAIシステムに共通する常識的な推論を必要とするタスクでパフォーマンスが劣ります。
AutoGPTによると、このモデルは論理的ループに捕まる可能性があり、応答が遅れることがあります。
欠点があるにもかかわらず、その推論能力は自らをファクトチェックすることを可能にし、エラーを減らしますが、解決時間は増加します。
タスクを推論し、ステップを計画することによって、アリババのモデルは従来のAIシステムに影響を与えるいくつかの落とし穴を回避します。しかし、このアプローチはリアルタイムの応用を制限する可能性がある追加の時間を要求します。
Benzingaによると、QwQ-32B-Previewの応答は中国の規制基準に沿っており、政治的に敏感なトピックを避けています。
例えば、台湾のような政治的に敏感なトピックは、中国政府の立場に沿った応答を返します。
さらに、天安門事件のような出来事に関するプロンプトは応答が出ないことを示しており、モデルの慎重な設計を示しています。
これは中国市場には理想的かもしれませんが、世界市場での魅力を制限する可能性もあります。しかし、このモデルは推論AIの世界への重要な一歩です。その限界が世界的な魅力を狭めるかもしれませんが、論理や半オープンな性質といった他の要素がOpenAIにとっての大きな競争相手となるでしょう。
AutoGPTによると、QwQ-32B-Previewは、世界中のAIラボが推論技術を洗練する方向に進んでいるこのエキサイティングな最前線の可能性と課題を強調しています。
ゼロからWeb3プロへ: あなたの90日間のキャリア立ち上げプラン
アリババの最新AIモデルQwQ-32B-Previewは、一部のベンチマークでOpenAIのO1を凌駕

クリエイターからの情報をさらに見る

最新ニュース