TLDR:

  • Llama de Meta es una familia de modelos de IA generativos abiertos con versiones 8B, 70B y 405B

  • Los modelos Llama 3.1 tienen ventanas de contexto de 128.000 tokens y pueden realizar varias tareas basadas en texto

  • Meta ofrece herramientas como Llama Guard y Prompt Guard para que Llama sea más seguro de usar.

  • Llama está disponible en las principales plataformas de nube y potencia los chatbots de IA de Meta

  • Existen preocupaciones sobre posibles problemas de derechos de autor con los datos de entrenamiento de Llama

Meta, el gigante tecnológico antes conocido como Facebook, ha logrado importantes avances en el campo de la inteligencia artificial con su última versión de la familia de modelos Llama. Llama 3.1, que se lanzará en julio de 2024, representa un gran avance en la IA de código abierto, ya que ofrece a los desarrolladores y a las empresas una herramienta poderosa para una amplia gama de aplicaciones.

Llama 3.1 viene en tres tamaños: 8B, 70B y 405B, en referencia a la cantidad de parámetros de cada modelo. Las versiones 8B y 70B están diseñadas para aplicaciones más compactas, capaces de ejecutarse en dispositivos que van desde computadoras portátiles hasta servidores. El modelo 405B, sin embargo, es una versión a gran escala que generalmente requiere hardware de centro de datos para un rendimiento óptimo.

Una de las características más destacadas de todos los modelos de Llama 3.1 es su impresionante ventana de contexto de 128.000 tokens, equivalentes a aproximadamente 100.000 palabras o 300 páginas de texto. Este amplio contexto permite que los modelos mantengan la coherencia y la relevancia a lo largo de períodos más largos de entrada, lo que potencialmente reduce los errores y mejora la calidad general del resultado.

Las capacidades de Llama 3.1 abarcan una amplia gama de tareas basadas en texto, como codificación, respuesta a preguntas matemáticas básicas y resumen de documentos en ocho idiomas diferentes. El modelo puede analizar varios tipos de archivos, incluidos archivos PDF y hojas de cálculo. Si bien Llama 3.1 actualmente no procesa ni genera imágenes, se puede configurar para aprovechar aplicaciones, herramientas y API de terceros para completar tareas.

Meta ha puesto Llama 3.1 a disposición de las principales plataformas de nube, en colaboración con más de 25 proveedores, entre ellos AWS, Google Cloud y Microsoft Azure. Esta amplia disponibilidad tiene como objetivo ofrecer a los desarrolladores opciones y flexibilidad a la hora de implementar y utilizar el modelo.

Para abordar las preocupaciones de seguridad, Meta ha presentado varias herramientas junto con Llama 3.1. Llama Guard sirve como marco de moderación para detectar contenido potencialmente problemático, mientras que Prompt Guard tiene como objetivo proteger contra ataques de inyección rápida. Además, CyberSecEval ofrece una suite para la evaluación de riesgos de ciberseguridad.

La naturaleza abierta de Llama 3.1 lo distingue de otros modelos de IA importantes como GPT-4 de OpenAI y Gemini de Google, a los que solo se puede acceder a través de API. Sin embargo, esta apertura también conlleva ciertas restricciones. Los desarrolladores de aplicaciones con más de 700 millones de usuarios mensuales deben solicitar una licencia especial a Meta para utilizar Llama 3.1.

A pesar de sus avances, Llama 3.1 no está exento de posibles problemas. Existen preocupaciones en curso sobre el uso de material protegido por derechos de autor en los datos de entrenamiento, lo que podría generar complicaciones legales para los usuarios. Meta ha enfrentado escrutinio y desafíos legales con respecto a sus prácticas de entrenamiento de IA, incluida una demanda que involucra a varios autores por presunto uso no autorizado de datos protegidos por derechos de autor.

El lanzamiento de Llama 3.1 coincide con avances más amplios en el campo de los modelos de lenguaje de gran tamaño. Otras empresas, como Microsoft con su modelo Orca 2, también están ampliando los límites de las capacidades de la IA. Estos avances están impulsando la necesidad de aplicaciones más especializadas de los modelos de IA.

Para satisfacer esta demanda, el ajuste fino se ha convertido en un proceso esencial. AWS de Amazon, por ejemplo, ahora ofrece herramientas a través de Amazon SageMaker JumpStart para ayudar a los desarrolladores a ajustar los modelos de Llama 3 para tareas específicas del dominio. Este proceso puede mejorar significativamente el rendimiento del modelo en aplicaciones específicas.

La publicación Meta lanza Llama 3.1: una mirada integral al modelo de inteligencia artificial de código abierto apareció primero en Blockonomi.