TLDR:

  • Llama da Meta é uma família de modelos de IA generativa aberta com versões 8B, 70B e 405B

  • Os modelos Llama 3.1 têm janelas de contexto de 128.000 tokens e podem executar várias tarefas baseadas em texto

  • Meta oferece ferramentas como Llama Guard e Prompt Guard para tornar o Llama mais seguro de usar

  • O Llama está disponível nas principais plataformas de nuvem e alimenta os chatbots de IA da Meta

  • Há preocupações sobre possíveis problemas de direitos autorais com os dados de treinamento do Llama

Meta, a gigante da tecnologia anteriormente conhecida como Facebook, fez avanços significativos no campo da inteligência artificial com sua mais recente iteração da família de modelos Llama. O Llama 3.1, lançado em julho de 2024, representa um grande avanço na IA de código aberto, oferecendo aos desenvolvedores e empresas uma ferramenta poderosa para uma ampla gama de aplicações.

O Llama 3.1 vem em três tamanhos: 8B, 70B e 405B, referindo-se ao número de parâmetros em cada modelo. As versões 8B e 70B são projetadas para aplicações mais compactas, capazes de rodar em dispositivos que variam de laptops a servidores. O modelo 405B, no entanto, é uma versão de larga escala que normalmente requer hardware de data center para desempenho ideal.

Um dos recursos de destaque de todos os modelos Llama 3.1 é sua impressionante janela de contexto de 128.000 tokens, equivalente a aproximadamente 100.000 palavras ou 300 páginas de texto. Esse contexto extensivo permite que os modelos mantenham coerência e relevância em longos períodos de entrada, potencialmente reduzindo erros e melhorando a qualidade geral da saída.

Os recursos do Llama 3.1 abrangem uma ampla gama de tarefas baseadas em texto. Isso inclui codificação, resposta a perguntas básicas de matemática e resumo de documentos em oito idiomas diferentes. O modelo pode analisar vários tipos de arquivo, incluindo PDFs e planilhas. Embora o Llama 3.1 não processe ou gere imagens atualmente, ele pode ser configurado para aproveitar aplicativos, ferramentas e APIs de terceiros para concluir tarefas.

A Meta disponibilizou o Llama 3.1 nas principais plataformas de nuvem, em parceria com mais de 25 provedores, incluindo AWS, Google Cloud e Microsoft Azure. Essa ampla disponibilidade visa dar aos desenvolvedores escolha e flexibilidade em como implementar e usar o modelo.

Para abordar preocupações de segurança, a Meta introduziu várias ferramentas junto com o Llama 3.1. O Llama Guard serve como uma estrutura de moderação para detectar conteúdo potencialmente problemático, enquanto o Prompt Guard visa proteger contra ataques de injeção rápida. Além disso, o CyberSecEval fornece um conjunto para avaliação de risco de segurança cibernética.

A natureza aberta do Llama 3.1 o diferencia de outros grandes modelos de IA, como o GPT-4 da OpenAI e o Gemini do Google, que são acessíveis somente por meio de APIs. No entanto, essa abertura também vem com certas restrições. Desenvolvedores de aplicativos com mais de 700 milhões de usuários mensais devem solicitar uma licença especial da Meta para usar o Llama 3.1.

Apesar de seus avanços, o Llama 3.1 não está livre de problemas potenciais. Há preocupações contínuas sobre o uso de material protegido por direitos autorais nos dados de treinamento, o que pode levar a complicações legais para os usuários. A Meta enfrentou escrutínio e desafios legais em relação às suas práticas de treinamento de IA, incluindo um processo envolvendo vários autores sobre o suposto uso não autorizado de dados protegidos por direitos autorais.

O lançamento do Llama 3.1 coincide com avanços mais amplos no campo de grandes modelos de linguagem. Outras empresas, como a Microsoft com seu modelo Orca 2, também estão expandindo os limites das capacidades de IA. Esses desenvolvimentos estão impulsionando a necessidade de aplicações mais especializadas de modelos de IA.

Para atender a essa demanda, o ajuste fino se tornou um processo essencial. A AWS da Amazon, por exemplo, agora oferece ferramentas por meio do Amazon SageMaker JumpStart para ajudar os desenvolvedores a ajustar os modelos Llama 3 para tarefas específicas do domínio. Esse processo pode melhorar significativamente o desempenho do modelo em aplicativos direcionados.

A postagem Meta lança Llama 3.1: uma visão abrangente do modelo de IA de código aberto apareceu primeiro em Blockonomi.