企業が大規模言語モデル(LLM)にお金を注ぎ込んでいる一方で、AIセクターの一部の業界専門家は、小規模言語モデル(SLM)が次の大きなものになると考えています。

これは、業界の活動が成長し続けている中、技術企業が技術を開発するためにより多くの資金を投資している祝祭シーズンが近づいていることを示しています。

未来は小さな言語モデルにあります。

マルチビリオネアのイーロン・マスクが運営するxAIは、アンドリーセン・ホロウィッツ、カタール投資庁、セコイア、バロー・エクイティ・パートナーズから追加の50億ドルを調達しました。また、アマゾンはOpenAIの競合であるAnthropicにさらに40億ドルを投資しました。

これらの大手テクノロジー企業や他の企業が、多くの異なるタスクを処理するための大規模なLLMの開発に数十億ドルを投資している中、AIの現実は、ビジネスのためにタスク特化型モデルが必要であるため、すべてに適したものは存在しないということです。

AWSの最高経営責任者マット・ガーマンは、彼らの拡大するパートナーシップと投資に関する発表の中で、Anthropicによって生成されたAIを開発しているAWS顧客からの圧倒的な反応がすでにあると述べています。

ほとんどの企業にとって、LLMは特定のプロジェクトに対する第一の選択肢ですが、他の企業にとっては、この選択がコスト、エネルギー、計算リソースの面で高価になる可能性があります。

テラデータの社長兼CEOであるスティーブン・マクミランは、一部の企業に代替の道を提供しているだけでなく、他の見解も持っています。彼は、未来がSLMにあると確信しています。

「私たちは未来を見据え、小規模および中規模の言語モデルと、ドメイン特化型LLMのような制御された環境が、はるかに優れた解決策を提供すると考えています。」

~ マクミラン

SLMは特定のデータタイプに基づいてカスタマイズされた出力を生成します。言語モデルはそのために特別にトレーニングされています。SLMによって生成されたデータは内部に保持されるため、言語モデルは潜在的に機密性の高いデータでトレーニングされています。

LLMがエネルギーを消費する中、小規模な言語モデルはプロジェクトの実際のニーズに合わせてコンピューティングとエネルギーの使用をスケールできるようにトレーニングされています。このような調整により、SLMは現在の大規模モデルよりも低コストで効率的です。

特定の知識のためにAIを使用したいユーザーには、広範な知識を提供しないドメイン特化型LLMの選択肢があります。それは情報の一つのカテゴリを深く理解し、より正確に応答するようにトレーニングされています。たとえば、CMOとCFOの違いにおいてです。

SLMが好まれる選択肢である理由

データサイエンティスト協会(ADaSci)によれば、100万人のユーザーのために70億のパラメータを持つSLMを完全に開発するには、わずか55.1MWh(メガワット時)が必要です。

ADaSciは、1750億のパラメータを持つGPT-3のトレーニングには推定で1287MWhの電力が消費され、その電力は公共に公式に使用される際には含まれないことを発見しました。したがって、SLMはLLMのトレーニングに消費されるエネルギーの約5%を使用します。

大規模モデルは通常、個々のデバイスで利用可能な計算能力を超えているため、クラウドコンピュータ上で運用されます。これにより、情報がクラウドに移動する際に企業が制御を失い、インターネットを通じて移動する際に応答が遅くなるという複雑な問題が生じます。

未来に向けて、企業によるAIの採用はすべてに適したものではなく、効率とタスクを完了するための最良かつ最も安価なツールの選択が焦点になるでしょう。これは、各プロジェクトに適したサイズのモデルを選択することを意味します。

これは、一般的なLLMであれ、小規模でドメイン特化型のLLMであれ、どのモデルがより良い結果を提供し、リソースを少なく要求し、データをクラウドに移行する必要を減らすかに応じて、すべてのモデルに対して行われます。

次のフェーズでは、AIがビジネスの意思決定に不可欠になるでしょう。一般の人々はAI生成の回答に高い信頼を寄せています。

「AIモデルのトレーニングを考えると、それは優れたデータの基盤の上に構築されなければなりません。」

~ マクミラン

「私たちが何をしているかというと、信頼できるデータセットを提供し、クライアントとその顧客が出力を信頼できるように、能力と分析機能を提供することです。」とマクミランは付け加えました。

効率と正確性が高く求められている世界では、小規模でドメイン特化型のLLMが、企業や一般の人々が信頼できる結果を提供するための別の選択肢を提供します。

Web3キャリアを開始し、高給の暗号職に90日で就くためのステップバイステップシステム。