Mentre le aziende stanno investendo denaro nei grandi modelli linguistici (LLM), alcuni esperti del settore nel settore dell'IA credono che i piccoli modelli linguistici (SLM) diventeranno la prossima grande novità.

Questo avviene mentre l'attività nel settore continua a crescere con l'avvicinarsi della stagione festiva, con le aziende tecnologiche che investono più fondi per sviluppare la propria tecnologia.

Il futuro è nei piccoli modelli linguistici

Le aziende come xAI, gestita dal miliardario Elon Musk, sono riuscite a raccogliere ulteriori 5 miliardi di dollari da Andreessen Horowitz, Qatar Investment Authority, Sequoia e Valor Equity Partners, mentre Amazon ha investito ulteriori 4 miliardi di dollari in Anthropic, un rivale di OpenAI.

Mentre queste grandi aziende tecnologiche e altre stanno investendo miliardi di dollari concentrandosi sullo sviluppo di grandi LLM per gestire molti compiti diversi, la realtà dell'IA è che non esiste una soluzione unica, poiché c'è bisogno di modelli specifici per compiti per le aziende.

Secondo il CEO di AWS Matt Garman in un comunicato sulla loro partnership e investimenti in espansione, c'è già una risposta travolgente da parte dei clienti AWS che stanno sviluppando IA generativa supportata da Anthropic.

Per la maggior parte delle aziende, gli LLM sono ancora la scelta numero uno per determinati progetti, ma per altri, questa scelta può essere costosa in termini di costi, energia e risorse di calcolo.

Steven McMillan, presidente e CEO di Teradata, che ha offerto un percorso alternativo per alcune aziende, ha anche altre opinioni. È positivo che il futuro sia negli SLM.

“Mentre guardiamo al futuro, pensiamo che i piccoli e medi modelli linguistici e gli ambienti controllati come gli LLM specifici per dominio forniranno soluzioni molto migliori.”

~ McMillan

Gli SLM producono output personalizzati su tipi specifici di dati poiché i modelli linguistici sono specificamente addestrati per farlo. Poiché i dati generati dagli SLM sono mantenuti internamente, i modelli linguistici sono quindi addestrati su dati potenzialmente sensibili.

Con gli LLM che consumano molta energia, le versioni linguistiche più piccole sono addestrate per adattare sia l'uso del calcolo che quello energetico alle reali esigenze del progetto. Con tali aggiustamenti, ciò significa che gli SLM sono efficienti a un costo inferiore rispetto ai modelli grandi attuali.

Per gli utenti che vogliono utilizzare l'IA per conoscenze specifiche, c'è l'opzione degli LLM specifici per dominio poiché non offrono una conoscenza ampia. Sono addestrati per comprendere a fondo solo una categoria di informazioni e rispondere in modo più preciso, per esempio un CMO rispetto a un CFO, in quel dominio.

Perché gli SLM sono un'opzione preferita

Secondo l'Associazione dei Data Scientists (ADaSci), sviluppare completamente un SLM con 7 miliardi di parametri per un milione di utenti richiederebbe solo 55,1MWh (megawattora).

ADaSci ha scoperto che addestrare GPT-3 con 175 miliardi di parametri ha consumato un stimato 1,287MWh di elettricità e l'energia non include quando viene ufficialmente utilizzata dal pubblico. Pertanto, un SLM utilizza circa il 5% dell'energia consumata tramite l'addestramento di un LLM.

I modelli grandi vengono solitamente eseguiti su computer cloud perché utilizzano più potenza di calcolo di quanto sia mai disponibile su un dispositivo individuale. Ciò comporta complicazioni per le aziende poiché perdono il controllo sulle proprie informazioni mentre si spostano nel cloud e risposte lente mentre viaggiano attraverso Internet.

Guardando al futuro, l'adozione dell'IA da parte delle aziende non sarà una soluzione unica, poiché l'efficienza e la selezione dello strumento migliore e meno costoso per completare i compiti saranno al centro dell'attenzione, il che significa scegliere il modello della giusta dimensione per ciascun progetto.

Questo sarà fatto per tutti i modelli, sia essi un LLM di uso generale, o LLM più piccoli e specifici per dominio a seconda di quale modello fornirà risultati migliori, richiederà meno risorse e ridurrà la necessità di migrare i dati nel cloud.

Per la prossima fase, l'IA sarà fondamentale per le decisioni aziendali, poiché il pubblico ha alta fiducia nelle risposte generate dall'IA.

“Quando pensi all'addestramento dei modelli di IA, devono essere costruiti sulla base di grandi dati.”

~ McMillan

“Questo è ciò di cui ci occupiamo, fornire quel set di dati di fiducia e poi fornire le capacità e le capacità analitiche affinché i clienti e i loro clienti possano fidarsi dei risultati,” ha aggiunto McMillan.

Con l'efficienza e l'accuratezza molto richieste nel mondo, LLM più piccoli e specifici per dominio offrono un'altra opzione per fornire risultati su cui le aziende e il pubblico più ampio possono fare affidamento.

Un sistema passo-passo per lanciare la tua carriera Web3 e ottenere lavori ben retribuiti nel settore delle criptovalute in 90 giorni.