Нова модель ШІ Alibaba QwQ-32B-Preview перевершує OpenAI O1 за деякими критеріями

З посиленням конкуренції в галузі ШІ китайський роздрібний гігант Alibaba представив QwQ-32B-Preview, який, за повідомленнями, перевершує серію o1 від OpenAI.
Остання модель, за повідомленнями, перевершує моделі o1-preview та o1-mini від OpenAI за деякими конкретними критеріями, такими як тести AIME та MATH, які оцінюють ефективність моделей ШІ у логічних головоломках та математичних задачах.
Alibaba зробила QwQ-32B-Preview доступним для завантаження.
На думку роздрібного гіганта, нова модель Alibaba здатна вирішувати складні та заплутані проблеми в порівнянні з нормальними великими мовними моделями (LLM), такими як ChatGPT-4 та Claude 3.5.
Стаття Benzinga вказує, що QwQ-32B-Preview є одним з небагатьох доступних під ліцензією, що дозволяє користувачам завантажувати та використовувати його. Модель тепер доступна на платформі розробки ШІ Hugging Face.
Однак Alibaba випустила певні компоненти моделі, щоб обмежити повне відтворення моделі або отримання уявлень про її роботу.
Остання модель Alibaba має 32,5 мільярда параметрів, що дозволяє їй обробляти запити до 32,000 слів. Завдяки значним можливостям моделі та напіввідкритій доступності новий учасник Alibaba прокладає шлях до трансформаційного стрибка в технологіях міркування ШІ.
Прозоре оголошення Alibaba, яке підкреслює складність її моделі, OpenAI тримає кількість своїх параметрів у таємниці.
Поява цієї моделі відбувається в час, коли OpenAI робить значні кроки вперед у секторі ШІ. У жовтні оцінка OpenAI зросла до 157 мільярдів доларів після успішного раунду фінансування.
Раніше цього тижня повідомлялося, що SoftBank Group SFTBF збільшила свою частку в компанії-розробнику ChatGPT через викуп акцій співробітників на суму 1,5 мільярда доларів.
Також повідомляється, що OpenAI розглядає можливість розробки свого власного веб-браузера, щоб кинути виклик дочірній компанії Alphabet, браузеру Google Chrome, після тиску з боку Міністерства юстиції США на розподіл активів.
Alibaba також визнає, що модель має недоліки
Хоча вона має деякі унікальні сильні сторони, нова модель також має обмеження. Згідно з групою, QwQ-32B-Preview має проблеми, такі як несподівані зміни мови, що може заплутувати користувачів. Модель також погано виконує завдання, що вимагають здорового глузду, що є характерним для багатьох систем ШІ.
Згідно з AutoGPT, модель може потрапити в логічні петлі, затримуючи відповіді.
Попри свої недоліки, її можливості міркування дозволяють їй перевіряти факти, що зменшує кількість помилок, але збільшує час розв'язання.
Розмірковуючи над завданнями та плануючи кроки, модель Alibaba уникає деяких пасток, які впливають на традиційні системи ШІ. Але цей підхід вимагає додаткового часу, що може обмежити застосування в реальному часі.
Згідно з Benzinga, відповіді QwQ-32B-Preview відповідають китайським регуляторним стандартам, уникаючи політично чутливих тем.
Наприклад, політично чутливі теми, такі як Тайвань, дадуть відповіді, що відповідають позиції китайського уряду.
Крім того, запити про такі події, як Тяньаньмень, не приводять до відповідей, що демонструє обережний дизайн моделі.
Хоча це може бути ідеально для китайського ринку, це також може обмежити її привабливість на глобальному ринку. Однак модель є значним кроком у світ розумного ШІ. Хоча її обмеження можуть звузити її глобальну привабливість, інші її компоненти, такі як логіка та напіввідкрита природа, роблять її великим конкурентом для OpenAI.
Згідно з AutoGPT, QwQ-32B-Preview підкреслює потенціал та виклики цього захоплюючого кордону, де лабораторії ШІ по всьому світу працюють над вдосконаленням технології міркування.
Від нуля до Web3 Pro: Ваш 90-денний план запуску кар'єри
Нова модель ШІ Alibaba QwQ-32B-Preview перевершує OpenAI O1 за деякими критеріями

Перегляньте більше від автора

Останні новини