Nvidia запускає вдосконалену модель ШІ, що перевершує GPT-4o та Claude-3

За даними Cointelegraph, Nvidia представила нову модель штучного інтелекту Llama-3.1-Nemotron-70B-Instruct 15 жовтня. Стверджується, що ця модель перевершує продуктивність провідних систем ШІ, включаючи GPT-4o і Claude-3. Обліковий запис розробника штучного інтелекту Nvidia оголосив про запуск моделі на платформі соціальних мереж X.com, підкресливши її статус найкращої результативності на Chatbot Arena lmarena.AI.
Llama-3.1-Nemotron-70B-Instruct — це модифікована версія Llama-3.1-70B-Instruct від Meta з відкритим кодом. Компонент «Nemotron» означає вдосконалення Nvidia. Моделі Meta Llama розроблені як основа з відкритим кодом для розробників. Nvidia удосконалила цю модель, використовуючи підібрані набори даних, передові методи тонкого налаштування та сучасне обладнання штучного інтелекту, щоб створити більш «корисну» систему штучного інтелекту порівняно з ChatGPT OpenAI та Claude-3 Anthropic.
Бенчмаркінг моделей штучного інтелекту передбачає порівняльне тестування, коли перед різними моделями ставляться однакові завдання та оцінюється їх продуктивність. Nvidia стверджує, що Nemotron значно перевершує існуючі найсучасніші моделі. Незважаючи на те, що Nemotron не значиться в таблицях лідерів Chatbot Arena, Nvidia стверджує, що він набрав 85 балів у автоматизованому тесті «Hard», що помістило б його на вершину цього розділу.
Це досягнення є примітним, враховуючи, що Llama-3.1-70B — це модель штучного інтелекту Meta середнього рівня з відкритим вихідним кодом, а також доступна більша версія Llama-3.1-405B. Для порівняння, GPT-4o, за оцінками, було розроблено з понад трильйоном параметрів.
Останні новини

Популярні статті