DeepSeek, компания ИИ, базирующаяся в Китае, запустила DeepSeek-R1-Lite-Preview для лучших возможностей рассуждения и решения проблем. Объявлено в посте на X, система позиционируется как конкурент лидерам отрасли, таким как OpenAI.
Комментаторы считают, что прозрачность DeepSeek иронична, когда компании на Западе не решили эти пробелы.
Новый запуск DeepSeek AI может лучше решать задачи по математике
DeepSeek, компания ИИ, базирующаяся в Китае, представила новую версию своей системы ИИ под названием DeepSeek-R1-Lite-Preview. В посте на X говорилось, что новая система ИИ имеет улучшенные способности к рассуждению и решению проблем.
Согласно DeepSeek, предварительный просмотр показывает хорошие результаты на эталонах, таких как AIME (Американская конкурсная математическая экзамен) и MATH, которые измеряют способности к решению проблем и рассуждению. Поскольку ИИ, похоже, хорошо справляется со сложными математическими и логическими задачами, он может быть готов конкурировать с ChatGPT от OpenAI и конкретно с OpenAI o1.
На этой неделе Le Chat от Mistral AI также объявил об обновлениях, позволяющих бесплатный доступ к новым функциям. Эти запуски, похоже, создают интенсивную конкурентную среду на рынке генеративного ИИ, преодолевая недостатки других.
DeepSeek думает вслух, в отличие от ChatGPT
DeepSeek утверждает, что его ИИ может показывать пошаговое рассуждение в реальном времени, чтобы сделать свой процесс мышления более прозрачным. Тем временем, компания ИИ также заявила, что они выпустят модель с открытым исходным кодом и инструменты для разработчиков API в ближайшие дни.
Согласно сравнительной таблице, приведенной комментатором ИИ и технологий Эндрю Карраном, DeepSeek-R1-Lite-Preview достигает наивысшего балла по параметрам, таким как AIME (52.5) и Codeforces (1450), обгоняя конкурентов, таких как OpenAI o1-preview и Claude 3.5 Sonnet.
Он также лидирует в MATH-500 (91.6), что указывает на высокую производительность в сложных задачах по решению проблем. Однако он отстает в GPQA Diamond (58.5) и Zebra Logic (56.6) по сравнению с моделями, такими как OpenAI o1-preview (73.3 и 71.4 соответственно). Эти цифры означают, что есть пространство для улучшения в сегментах общей осведомленности и логического рассуждения.
Два месяца спустя после объявления о предварительном просмотре o1, и его цепочка размышлений была воспроизведена. Кит теперь может рассуждать. DeepSeek утверждает, что официальная версия DeepSeek-R1 будет полностью с открытым исходным кодом. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Эндрю Карран (@AndrewCurran_) 20 ноября 2024
Cryptopolitan протестировал функции запуска для беспристрастного обзора. Во-первых, чат DeepSeek требует входа пользователя. Чат в функции 'Глубокое мышление' ограничивает разговоры до 50 сообщений в день. Мы можем сказать, что Deepseek думает громко, одновременно оценивая свое время ответа. Он также решил математическую задачу, которую мы представили, в логическом порядке. В сравнении с ChatGPT 4o, на решение потребовалось меньше времени, но он не представил пошаговое рассуждение по этому поводу.
Как DeepSeek реагирует на математические задачиКак ChatGPT-4o реагирует на математические задачи
Инфлюенсер Билавал Сидху высказал критику в адрес o1 и заявил: «Иронично, что модель OpenAI o1 скрывает свою цепочку размышлений, в то время как китайский DeepSeek-R1 делает это прозрачным для пользователей. Разве не должно быть наоборот?»
При этом у Китая есть всеобъемлющая структура вокруг ИИ. 13 июля 2023 года несколько китайских властей, включая Администрацию киберпространства Китая (CAC) и Министерство образования, представили новые правила для технологий генеративного ИИ. Эти правила, называемые Регулированием генеративного ИИ, официально вступили в силу в прошлом году 15 августа.
Объем регулирования, как сообщается, охватывает использование алгоритмов, технологий глубокого синтеза, использование всех технологий генеративного ИИ и несколько других технологических мероприятий. И с его прозрачным подходом к рассуждениям, высокой производительностью на конкурентных эталонах и планами по выпуску инструментов с открытым исходным кодом, DeepSeek раздвигает границы генеративного ИИ в Китае и среди своих конкурентов на глобальном уровне.
Пошаговая система для запуска вашей карьеры в Web3 и получения высокооплачиваемых крипторабот за 90 дней.