总部位于中国的人工智能公司 DeepSeek 推出了 DeepSeek-R1-Lite-Preview,以提高推理和解决问题的能力。该系统在 X 上的一篇文章中宣布,定位为 OpenAI 等行业领导者的竞争对手。

评论人士认为,在西方公司尚未解决这些差距的情况下,DeepSeek 的透明度具有讽刺意味。

DeepSeek AI 的新产品能更好地完成数学运算

中国的人工智能公司 DeepSeek 推出了其人工智能系统的新版本,名为 DeepSeek-R1-Lite-Preview。该公司在 X 上的一篇文章中表示,新人工智能系统的推理和解决问题的能力有所提高。

据 DeepSeek 称,该预览版在 AIME(美国数学邀请赛)和 MATH 等衡量解决问题和推理能力的基准测试中表现良好。由于该人工智能似乎擅长处理复杂的数学和逻辑问题,它可能已经准备好与 OpenAI 的 ChatGPT 竞争,尤其是与 OpenAI o1 竞争。

本周,Mistral AI 的 Le Chat 也宣布了更新,允许免费使用新功能。这些更新似乎在生成 AI 市场中创造了激烈的竞争,并克服了其他公司的缺点。

DeepSeek 与 ChatGPT 不同,它能大声思考

DeepSeek 表示,其 AI 可以展示分步实时推理,使其思维过程更加透明。同时,该 AI 公司还表示,他们将在未来几天发布开源模型和 API 开发人员工具。

根据人工智能和科技评论员 Andrew Curran 引用的对比图表,DeepSeek-R1-Lite-Preview 在 AIME(52.5)和 Codeforces(1450)等参数中取得了最高分,超越了 OpenAI o1-preview 和 Claude 3.5 Sonnet 等竞争对手。

它还在 MATH-500(91.6)中领先,表明它在高级问题解决任务中表现出色。然而,与 OpenAI o1-preview(分别为 73.3 和 71.4)等模型相比,它在 GPQA Diamond(58.5)和 Zebra Logic(56.6)中落后。这些数字意味着在常识和逻辑推理方面还有改进的空间。

o1-preview 发布两个月后,其 Chain-of-Thought 推理已被复制。鲸鱼现在可以推理了。DeepSeek 表示,DeepSeek-R1 的正式版本将完全开源。https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz

— Andrew Curran (@AndrewCurran_) 2024 年 11 月 20 日

Cryptopolitan 试用了发布的功能,以便进行公正的评价。首先,DeepSeek 的聊天需要用户登录。“深度思考”功能下的聊天将对话限制为每天最多 50 条消息。我们可以说 Deepseek 会大声思考,同时估计其响应时间。它还以合乎逻辑的顺序解决了我们提出的数学问题。相比之下,ChatGPT 4o 解决问题所花的时间更少,但没有提供分步推理。

DeepSeek 如何应对数学问题ChatGPT-4o 如何回答数学问题

影响者 Bil​​awal Sidhu 嘲讽了 o1,并表示:“具有讽刺意味的是,OpenAI 的 o1 模型隐藏了其思路链推理,而中国的 DeepSeek-R1 却让用户看得一清二楚。难道不应该反过来吗?”

尽管如此,中国在人工智能方面拥有全面的框架。2023 年 7 月 13 日,包括中国国家互联网信息办公室 (CAC) 和教育部在内的多个中国部门出台了针对生成式人工智能技术的新法规。这些规则被称为《生成式人工智能条例》,于去年 8 月 15 日正式生效。

据报道,该监管范围涵盖算法的使用、深度合成技术、所有生成式人工智能技术的使用以及其他几项技术活动。凭借其透明的推理方法、在竞争基准上的强劲表现以及发布开源工具的计划,DeepSeek 正在中国和全球竞争对手中突破生成式人工智能的界限。

一个循序渐进的系统,帮助您在 90 天内开启您的 Web3 职业生涯并获得高薪加密工作。