Alors que les entreprises investissent de l'argent dans de grands modèles linguistiques (LLM), certains experts de l'industrie dans le secteur de l'IA croient que les petits modèles linguistiques (SLM) deviendront la prochaine grande chose.
Cela survient alors que l'activité dans l'industrie continue de croître avec l'arrivée de la saison festive, les entreprises technologiques investissant davantage de fonds pour développer leur technologie.
L'avenir est dans les petits modèles linguistiques
Des entreprises comme xAI dirigées par le multi-milliardaire Elon Musk ont réussi à lever 5 milliards de dollars supplémentaires auprès d'Andreessen Horowitz, de Qatar Investment Authority, de Sequoia et de Valor Equity Partners, tandis qu'Amazon a investi 4 milliards de dollars supplémentaires dans Anthropic, un rival d'OpenAI.
Alors que ces grandes entreprises technologiques et d'autres investissent des milliards de dollars pour développer de grands LLM pour gérer de nombreuses tâches différentes, la réalité de l'IA est qu'il n'y a pas de solution universelle, car il y a besoin de modèles spécifiques à des tâches pour les entreprises.
Selon le directeur général d'AWS, Matt Garman, dans un communiqué sur leur partenariat et leurs investissements en expansion, il y a déjà une réponse écrasante des clients d'AWS qui développent une IA générative alimentée par Anthropic.
Les LLM sont pour la plupart des entreprises encore le choix numéro un pour certains projets, mais pour d'autres, ce choix peut être coûteux en termes de coûts, d'énergie et de ressources informatiques.
Steven McMillan, président et PDG de Teradata, qui a proposé un chemin alternatif pour certaines entreprises, a également d'autres opinions. Il est positif que l'avenir soit dans les SLM.
“Alors que nous regardons vers l'avenir, nous pensons que les petits et moyens modèles linguistiques et les environnements contrôlés tels que les LLM spécifiques à un domaine fourniront des solutions beaucoup meilleures.”
~ McMillan
Les SLM produisent des sorties personnalisées sur des types de données spécifiques, car les modèles linguistiques sont spécifiquement formés pour cela. Étant donné que les données générées par les SLM sont conservées en interne, les modèles linguistiques sont donc formés sur des données potentiellement sensibles.
Avec les LLM étant énergivores, les petites versions linguistiques sont formées pour adapter à la fois l'utilisation informatique et énergétique aux besoins réels du projet. Avec de tels ajustements, cela signifie que les SLM sont efficaces à un coût inférieur à celui des grands modèles actuels.
Pour les utilisateurs qui souhaitent utiliser l'IA pour des connaissances spécifiques, il existe l'option des LLM spécifiques à un domaine, car ils n'offrent pas de connaissances larges. Ils sont formés pour comprendre profondément une seule catégorie d'informations et répondre plus précisément, par exemple un CMO contre un CFO, dans ce domaine.
Pourquoi les SLM sont une option privilégiée
Selon l'Association des scientifiques des données (ADaSci), le développement complet d'un SLM avec 7 milliards de paramètres pour un million d'utilisateurs nécessiterait seulement 55,1 MWh (mégawattheures).
ADaSci a découvert que former GPT-3 avec 175 milliards de paramètres a consommé environ 1 287 MWh d'électricité, et cette puissance ne comprend pas lorsqu'elle est officiellement mise en service par le public. Par conséquent, un SLM utilise environ 5 % de l'énergie consommée lors de la formation d'un LLM.
Les grands modèles sont généralement exécutés sur des ordinateurs cloud car ils utilisent plus de puissance de calcul que ce qui est jamais disponible sur un appareil individuel. Cela entraîne des complications pour les entreprises, car elles perdent le contrôle de leurs informations lorsqu'elles passent dans le cloud, et des réponses lentes lorsqu'elles circulent sur Internet.
En allant vers l'avenir, l'adoption de l'IA par les entreprises ne sera pas une solution universelle car l'efficacité et le choix de l'outil le meilleur et le moins coûteux pour accomplir les tâches seront au centre des préoccupations, ce qui signifie choisir le modèle de taille appropriée pour chaque projet.
Cela sera fait pour tous les modèles, qu'il s'agisse d'un LLM à usage général ou de LLM plus petits et spécifiques à un domaine, selon le modèle qui fournira de meilleurs résultats, nécessitera moins de ressources et réduira le besoin de migrer des données vers le cloud.
Pour la prochaine phase, l'IA sera vitale pour les décisions commerciales, car le public a une grande confiance dans les réponses générées par l'IA.
“Lorsque vous pensez à la formation des modèles d'IA, ils doivent être construits sur la base de grandes données.”
~ McMillan
“C'est ce que nous faisons, fournir cet ensemble de données de confiance et ensuite fournir les capacités et les capacités d'analyse afin que les clients, et leurs clients, puissent faire confiance aux sorties,” a ajouté McMillan.
Avec l'efficacité et la précision étant en forte demande dans le monde, des LLM plus petits et spécifiques à un domaine offrent une autre option pour fournir des résultats sur lesquels les entreprises et le grand public peuvent compter.
Un système étape par étape pour lancer votre carrière Web3 et décrocher des emplois crypto bien rémunérés en 90 jours.