Nvidia lance un modèle d'IA avancé surpassant GPT-4o et Claude-3

Selon Cointelegraph, Nvidia a présenté le 15 octobre un nouveau modèle d'intelligence artificielle, Llama-3.1-Nemotron-70B-Instruct. Ce modèle est censé surpasser les performances des principaux systèmes d'IA, notamment GPT-4o et Claude-3. Le compte AI Developer de Nvidia a annoncé le lancement du modèle sur la plateforme de médias sociaux X.com, soulignant son statut de modèle le plus performant sur l'arène des chatbots de lmarena.AI.
Llama-3.1-Nemotron-70B-Instruct est une version modifiée du Llama-3.1-70B-Instruct open source de Meta. Le composant « Nemotron » symbolise les améliorations apportées par Nvidia. Les modèles Llama de Meta sont conçus comme des fondations open source pour les développeurs. Nvidia a affiné ce modèle à l'aide d'ensembles de données organisés, de méthodes de réglage avancées et de son matériel d'IA de pointe, dans le but de créer un système d'IA plus « utile » par rapport à ChatGPT d'OpenAI et Claude-3 d'Anthropic.
L'évaluation comparative des modèles d'IA implique des tests comparatifs, où différents modèles se voient confier les mêmes tâches et leurs performances sont évaluées. Nvidia affirme que Nemotron surpasse considérablement les modèles de pointe existants. Bien que Nemotron ne figure pas dans les classements de Chatbot Arena, Nvidia affirme qu'il a obtenu un score de 85 au test automatisé « Hard », ce qui le placerait en tête de cette section.
Cette réussite est remarquable étant donné que Llama-3.1-70B est le modèle d’IA open source de milieu de gamme de Meta, avec une version plus grande, Llama-3.1-405B, également disponible. En comparaison, on estime que GPT-4o a été développé avec plus d’un trillion de paramètres.
Dernières actualités