SLMはAIの次のゲームチェンジャーですか?

AI産業が大規模言語モデル(LLM)に重点を置く一方で、小型言語モデル(SLM)がすぐに中心的な役割を果たすと信じる専門家の増加が見られます。

技術企業が賑やかなホリデーシーズンに生成AIへの投資を増やす中、会話はモノリシックシステムよりもカスタマイズされたソリューションの必要性にシフトしています。

LLMは多様なタスクを処理するのに優れていますが、リソースを多く消費することが多く、コスト、エネルギー消費、計算要求において課題をもたらします。

AWSのCEOマット・ガーマンによると、アンソロピックのようなモデルによって生成されるAIを活用する企業からの関心はすでに大きいです。

しかし、LLMは一部の領域で支配的であるものの、普遍的な適合性はありません。

テラデータCEOスティーブン・マクミランは、SLMがAIの未来であると強調し、タスク特化型出力を提供する能力を強調しています。

マクミランは述べました:

「未来を見据えると、小型および中型の言語モデルとドメイン特化型LLMのような制御された環境が、はるかに良いソリューションを提供すると考えています。」

SLMは目的に応じて構築され、特定のデータセットで訓練されることで、高度に関連性のある洞察を提供しながらデータプライバシーを確保します。

小型言語モデルの包括的な調査

小型言語モデル(SLM)に関する素晴らしい調査と、定義、用途、強化、信頼性などに関する問題についての議論。 https://t.co/qVxuY1jWDE pic.twitter.com/WZuRm1fqU4

— エルビス (@omarsar0) 2024年11月7日

彼らは、大きなモデルに比べて、プロジェクトのニーズに応じてエネルギーと計算リソースを最適化し、コスト効果が高く効率的な代替手段を提供します。

特定の領域において深い専門知識が必要な企業にとって、専門的なモデル(ドメイン特化型LLMまたはSLM)は比類のない精度を提供します。たとえば、最高マーケティング責任者(CMO)用にカスタマイズされたモデルと最高財務責任者(CFO)用のモデルは、それぞれのトレーニング分野内で非常に文脈に即した関連情報を提供します。

AIの風景が進化する中で、SLMの台頭は、精度、効率、スケーラビリティの需要の高まりを示しています。これらの特性は、インテリジェントシステムの未来を再定義する可能性があります。

SLMはより良い選択肢ですか?

データサイエンティスト協会(ADaSci)は、10億人のユーザーにサービスを提供するために70億のパラメータを持つSLMを開発するには、わずか55.1 MWh(メガワット時間)の電力が必要だと推定しています。

対照的に、1750億のパラメータを持つGPT-3の訓練には、驚異的な1287 MWhが消費され、モデルがアクティブに展開されているときに使用されるエネルギーは考慮されていません。

これは、SLMがLLMによって必要とされるエネルギーの約5%を使用することを意味します。

LLMはその膨大な計算要求のため、通常はクラウドサーバーで運用され、これにより企業はデータの管理を失い、情報がインターネットを通じて移動するため応答時間が遅くなることが多いです。

弱い方が良い - @GoogleDeepMindからの素晴らしい論文

**問題**🔍:

強力なLMからの高品質な合成データで言語モデル(LM)を訓練することは、推論予算が固定されている場合、計算最適ではないかもしれませんが、推論を改善するために一般的です。

**この論文からの重要な洞察… pic.twitter.com/PIbhSN3zVV

— ローハン・ポール (@rohanpaul_ai) 2024年9月28日

企業がAIをますます採用する中、すべてに適合する単一のモデルはないことは明らかです。

企業は、各プロジェクトに最も適したモデルを選択することで、効率、コスト効果、クラウドへのデータ転送の最小化を優先します。これが一般的なLLMであれ、より小規模で専門的なモデルであれ。

この進化する状況では、効率と精度が最も重要になります。

マクミランは言いました:

「AIモデルの訓練を考えると、それは優れたデータの基盤の上に構築されなければなりません。」

彼は追加しました:

「それが私たちの使命であり、信頼できるデータセットを提供し、クライアントとその顧客が出力を信頼できるように、能力と分析能力を提供することです。」

小型のドメイン特化型LLMは魅力的な代替手段を提供し、企業が大規模モデルの重いリソースコストや複雑さを克服しながらAIの力を活用することを可能にします。

AIがビジネスの意思決定において中心的な役割を果たすようになるにつれて、各タスクに適したモデルを選択することが重要になり、信頼性とスケーラブルな結果を保証します。