Mientras las empresas están invirtiendo dinero en modelos de lenguaje grandes (LLMs), algunos expertos de la industria en el sector de la IA creen que los modelos de lenguaje pequeños (SLMs) se convertirán en la próxima gran cosa.

Esto ocurre a medida que la actividad en la industria sigue creciendo con la llegada de la temporada festiva, con empresas tecnológicas invirtiendo más fondos para desarrollar su tecnología.

El futuro está en los modelos de lenguaje pequeños

Los de xAI, dirigido por el multimillonario Elon Musk, lograron recaudar $5 mil millones adicionales de Andreessen Horowitz, Qatar Investment Authority, Sequoia y Valor Equity Partners, mientras que Amazon invirtió $4 mil millones adicionales en Anthropic, un rival de OpenAI.

Mientras estas grandes empresas tecnológicas y otras están invirtiendo miles de millones de dólares enfocándose en desarrollar grandes LLMs para manejar muchas tareas diferentes, la realidad de la IA es que no hay una solución única, ya que hay necesidad de modelos específicos para tareas en los negocios.

Según el director ejecutivo de AWS, Matt Garman, en un comunicado sobre su asociación en expansión e inversiones, ya hay una respuesta abrumadora de los clientes de AWS que están desarrollando IA generativa impulsada por Anthropic.

Los LLMs para la mayoría de las empresas siguen siendo la opción número uno para ciertos proyectos, pero para otros, esta elección puede ser costosa en términos de costo, energía y recursos computacionales.

Steven McMillan, presidente y CEO de Teradata, que ha ofrecido un camino alternativo para algunas empresas, también tiene otras opiniones. Él es positivo de que el futuro está en los SLMs.

“A medida que miramos hacia el futuro, pensamos que los modelos de lenguaje pequeños y medianos y los entornos controlados como los LLMs específicos del dominio, proporcionarán soluciones mucho mejores.”

~ McMillan

Los SLMs producen salidas personalizadas sobre tipos específicos de datos, ya que los modelos de lenguaje están específicamente entrenados para hacer eso. Dado que los datos generados por los SLMs se mantienen internamente, los modelos de lenguaje, por lo tanto, se entrenan con datos potencialmente sensibles.

Con los LLMs consumiendo mucha energía, las versiones de lenguaje pequeño están entrenadas para escalar tanto el uso de computación como de energía a las necesidades reales del proyecto. Con tales ajustes, significa que los SLMs son eficientes a un costo menor que los modelos grandes actuales.

Para los usuarios que quieren usar IA para conocimiento específico, existe la opción de LLMs específicos del dominio, ya que no ofrecen un conocimiento amplio. Se entrena para comprender profundamente solo una categoría de información y responder con mayor precisión, por ejemplo, un CMO frente a un CFO, en ese dominio.

Por qué los SLMs son una opción preferida

Según la Asociación de Científicos de Datos (ADaSci), desarrollar completamente un SLM con 7 mil millones de parámetros para un millón de usuarios requeriría solo 55.1MWh (megavatios hora).

ADaSci descubrió que entrenar GPT-3 con 175 mil millones de parámetros consumió un estimado de 1,287MWh de electricidad y el poder no incluye cuando entra oficialmente en uso por el público. Por lo tanto, un SLM utiliza aproximadamente el 5% de la energía consumida al entrenar un LLM.

Los modelos grandes suelen ejecutarse en computadoras en la nube porque utilizan más poder de computación del que está disponible en un dispositivo individual. Esto resulta en complicaciones para las empresas, ya que pierden el control sobre su información a medida que se mueve a la nube, y respuestas lentas mientras viajan a través de internet.

De cara al futuro, la adopción de IA por parte de las empresas no será una solución única, ya que la eficiencia y la selección de la herramienta más adecuada y menos costosa para completar tareas estarán en el foco, lo que significa elegir el modelo de tamaño adecuado para cada proyecto.

Esto se hará para todos los modelos, ya sea un LLM de propósito general, o LLMs más pequeños y específicos del dominio, dependiendo de qué modelo ofrecerá mejores resultados, requerirá menos recursos y reducirá la necesidad de migrar datos a la nube.

Para la próxima fase, la IA será vital para las decisiones empresariales, ya que el público tiene alta confianza en las respuestas generadas por IA.

“Cuando piensas en entrenar modelos de IA, deben estar construidos sobre la base de grandes datos.”

~ McMillan

“Eso es de lo que se trata, proporcionar ese conjunto de datos confiables y luego proporcionar las capacidades y capacidades analíticas para que los clientes y sus clientes puedan confiar en las salidas,” agregó McMillan.

Con la eficiencia y la precisión siendo muy demandadas en el mundo, los LLMs más pequeños y específicos del dominio ofrecen otra opción para entregar resultados en los que las empresas y el público en general pueden confiar.

Un sistema paso a paso para lanzar tu carrera Web3 y conseguir trabajos de criptomonedas bien remunerados en 90 días.