Nvidia, uma corporação multinacional e empresa de tecnologia, anunciou o lançamento de um novo serviço que ajuda empresas e países a construir supercomputadores personalizados e especializados usando o mais recente LLM da Meta, Llama 3.1. 

A Nvidia lançou dois novos serviços direcionados a empresas e países. A gigante da tecnologia lançou um serviço dentro do Nvidia AI Foundry e microsserviços de inferência dentro do NVIDIA NIM. Ambos os serviços aproveitam a mais recente biblioteca LLMs de código aberto da Meta, Llama 3.1, e podem criar supercomputadores generativos de IA. 

A Nvidia AI Foundry ajudará empresas e países a criar modelos super LLM personalizados para requisitos e necessidades específicas do setor. Isso é possível através do uso do Llama 3.1 e do software, hardware e talento da Nvidia. Empresas e países terão a opção de treinar esses supermodelos usando dados proprietários ou dados sintéticos gerados a partir do Llama 3.1 e do modelo de recompensa Nvidia Nemotron.

Leia também: Tesla começará a usar bots humanóides em 2025, diz Elon Musk

O Llama 3.1, lançado hoje, tem 405 bilhões de parâmetros e está posicionado para competir com modelos de IA de código fechado, como ChatGPT e Gemini. A Meta está melhorando continuamente o Llama, fornecendo componentes adicionais que funcionam com o modelo. Meta e Nvidia fizeram parceria para integrar o Llama 3.1 aos serviços da Nvidia, disponibilizando a solução desde o primeiro dia. O CEO da Nvidia, Jensen Huang, disse:

“…NVIDIA AI Foundry integrou o Llama 3.1 e está pronto para ajudar as empresas a construir e implantar supermodelos Llama personalizados.”  

Os modelos generativos de IA do Llama 3.1 são treinados em mais de 16.000 GPUs Nvidia H100 Tensor Core. Além disso, eles são otimizados para computação e software acelerados da Nvidia, que permitem implantação em data centers, nuvens e computadores pessoais com GPU.

Leia também: Meta revela a maior versão do modelo Llama 3 AI

Atualmente, muitas empresas em todo o mundo têm acesso a microsserviços NIM para Llama. A Accenture é o primeiro cliente a construir supermodelos Llama personalizados para Aramco, AT&T e Uber. Essas empresas serão as primeiras a acessar microsserviços NIM usando o Llama 3.1. Depois de criar modelos personalizados com sucesso, uma empresa pode escolher os microsserviços da Nvidia, uma plataforma OPs e uma plataforma em nuvem para executar os modelos. 

Na semana passada, a Mistral AI lançou um novo modelo 12B chamado Mistral NeMo em colaboração com a Nvidia. O modelo está disponível como um microsserviço de inferência Nvidia NIM. Em relação ao novo hardware GPU, um vazador afirmou que a empresa de tecnologia de hardware lançará um novo Gen RTX 5090D apenas para o mercado chinês. A nova GPU será a sucessora do RTX 4090D.