Według Cointelegraph, 15 października firma Nvidia wprowadziła nowy model sztucznej inteligencji, Llama-3.1-Nemotron-70B-Instruct. Model ten ma przewyższać wydajnością wiodące systemy AI, w tym GPT-4o i Claude-3. Konto dewelopera AI firmy Nvidia ogłosiło premierę modelu na platformie społecznościowej X.com, podkreślając jego status jako najlepszego wykonawcy na Chatbot Arena firmy lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct to zmodyfikowana wersja open-source'owego Llama-3.1-70B-Instruct firmy Meta. Komponent „Nemotron” oznacza ulepszenia firmy Nvidia. Modele Llama firmy Meta są projektowane jako fundamenty open-source dla programistów. Firma Nvidia udoskonaliła ten model, korzystając z wyselekcjonowanych zestawów danych, zaawansowanych metod dostrajania i najnowocześniejszego sprzętu AI, mając na celu stworzenie bardziej „pomocnego” systemu AI w porównaniu do ChatGPT firmy OpenAI i Claude-3 firmy Anthropic.

Benchmarking modeli AI obejmuje testy porównawcze, w których różne modele otrzymują te same zadania, a ich wydajność jest oceniana. Nvidia twierdzi, że Nemotron znacznie przewyższa istniejące najnowocześniejsze modele. Chociaż Nemotron nie jest wymieniony na listach rankingowych Chatbot Arena, Nvidia twierdzi, że uzyskał 85 punktów w zautomatyzowanym teście „Hard”, co umieściłoby go na szczycie tej sekcji.

To osiągnięcie jest godne uwagi, biorąc pod uwagę, że Llama-3.1-70B to średniej klasy model open-source AI Meta, z większą wersją, Llama-3.1-405B, również dostępną. Dla porównania szacuje się, że GPT-4o został opracowany z ponad jednym bilionem parametrów.