Nvidia lança modelo avançado de IA superando GPT-4o e Claude-3

De acordo com a Cointelegraph, a Nvidia introduziu um novo modelo de inteligência artificial, Llama-3.1-Nemotron-70B-Instruct, em 15 de outubro. Este modelo supostamente supera o desempenho dos principais sistemas de IA, incluindo GPT-4o e Claude-3. A conta de desenvolvedor de IA da Nvidia anunciou o lançamento do modelo na plataforma de mídia social X.com, destacando seu status como um dos melhores desempenhos na Chatbot Arena da lmarena.AI.
Llama-3.1-Nemotron-70B-Instruct é uma versão modificada do Llama-3.1-70B-Instruct de código aberto da Meta. O componente 'Nemotron' representa os aprimoramentos da Nvidia. Os modelos Llama da Meta são projetados como fundações de código aberto para desenvolvedores. A Nvidia refinou este modelo usando conjuntos de dados selecionados, métodos avançados de ajuste fino e seu hardware de IA de última geração, visando criar um sistema de IA mais 'útil' em comparação ao ChatGPT da OpenAI e ao Claude-3 da Anthropic.
O benchmarking de modelos de IA envolve testes comparativos, onde diferentes modelos recebem as mesmas tarefas e seu desempenho é avaliado. A Nvidia afirma que o Nemotron supera significativamente os modelos de última geração existentes. Embora o Nemotron não esteja listado nas tabelas de classificação do Chatbot Arena, a Nvidia afirma que obteve 85 no teste automatizado 'Hard', o que o colocaria no topo desta seção.
Essa conquista é notável, dado que o Llama-3.1-70B é o modelo de IA de código aberto de nível médio da Meta, com uma versão maior, Llama-3.1-405B, também disponível. Em comparação, estima-se que o GPT-4o tenha sido desenvolvido com mais de um trilhão de parâmetros.
Últimas Notícias