DeepSeek, китайська AI-компанія, запустила DeepSeek-R1-Lite-Preview для кращих можливостей міркування та розв'язання проблем. Оголошено в пості в X, система позиціонується як конкурент лідерам галузі, таким як OpenAI.
Коментатори вважають, що прозорість DeepSeek іронічна, коли компанії на Заході не вирішили ці прогалини.
Новий запуск DeepSeek AI може виконувати математику краще
DeepSeek, AI-компанія з Китаю, представила нову версію своєї AI-системи під назвою DeepSeek-R1-Lite-Preview. У пості в X зазначено, що нова AI-система має покращені можливості міркування та розв'язання проблем.
За словами DeepSeek, попередній перегляд добре показує себе на бенчмарках, таких як AIME (Американська запрошена математична олімпіада) та MATH, які вимірюють можливості розв'язання проблем і міркування. Оскільки AI, здається, вміє справлятися зі складними математичними та логічними проблемами, він може бути готовий змагатися з ChatGPT від OpenAI, а саме з OpenAI o1.
Цього тижня Le Chat від Mistral AI також оголосив про оновлення, щоб дозволити безкоштовний доступ до нових функцій. Запуски, здається, створюють інтенсивну конкуренцію на ринку генеративного AI, долаючи недоліки інших.
DeepSeek думає вголос, на відміну від ChatGPT
DeepSeek заявляє, що його AI може показувати покрокове міркування в реальному часі, щоб зробити свій процес мислення більш прозорим. Тим часом AI-компанія також заявила, що вони випустять модель з відкритим кодом та інструменти для розробників API найближчими днями.
Згідно з таблицею порівняння, на яку посилається коментатор AI та технологій Ендрю Керран, DeepSeek-R1-Lite-Preview досягає найвищого балу в параметрах, таких як AIME (52.5) та Codeforces (1450), перевершуючи конкурентів, таких як OpenAI o1-preview та Claude 3.5 Sonnet.
Він також лідирує в MATH-500 (91.6), що вказує на високу продуктивність у завданнях з просунутого розв'язування проблем. Однак він відстає в GPQA Diamond (58.5) та Zebra Logic (56.6) у порівнянні з моделями, такими як OpenAI o1-preview (73.3 та 71.4, відповідно). Ці показники означають, що є можливість для покращення в сегментах загальних знань та логічного міркування.
Два місяці після оголошення o1-preview, і його міркування у ланцюгу думок було відтворено. Whale тепер може міркувати. DeepSeek повідомляє, що офіційна версія DeepSeek-R1 буде повністю з відкритим кодом. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Ендрю Керран (@AndrewCurran_) 20 листопада 2024 року
Cryptopolitan спробував функції запуску для безстороннього огляду. По-перше, чат DeepSeek вимагає входу користувача. Чат під функцією 'Deep Think' обмежує розмови до 50 повідомлень на день. Ми можемо сказати, що Deepseek думає голосно, одночасно оцінюючи свій час відповіді. Він також розв'язав математичну задачу, яку ми представили, у логічному порядку. У порівнянні, ChatGPT 4o витратив менше часу на розв'язання, але не представив покрокове міркування для цього.
Як DeepSeek відповідає на математичні задачі Як ChatGPT-4o відповідає на математичні задачі
Інфлюенсер Білавал Сідху зробив зауваження на адресу o1 і зазначив: "Іронічно, що модель o1 від OpenAI приховує своє міркування у ланцюгу думок, тоді як китайський DeepSeek-R1 робить це прозорим для користувачів. Хіба не повинно бути навпаки?"
Тим не менш, Китай має комплексну структуру навколо AI. 13 липня 2023 року кілька китайських органів, включаючи Адміністрацію кіберпростору Китаю (CAC) та Міністерство освіти, запровадили нові регуляції для генеративних AI-технологій. Ці правила, які називаються Регулюванням генеративного AI, офіційно набули чинності минулого року 15 серпня.
Область регулювання, за повідомленнями, охоплює використання алгоритмів, технологій глибокого синтезу, використання всіх генеративних AI-технологій та кількох інших технологічних діяльностей. І з його прозорим підходом до міркування, сильною продуктивністю на конкурентних бенчмарках та планами випустити інструменти з відкритим кодом, DeepSeek розширює межі генеративного AI в Китаї та серед своїх конкурентів у всьому світі.
Покрокова система для запуску вашої кар'єри у Web3 та отримання високооплачуваних крипто-робіт за 90 днів.