OpenAI 在修改后的命名方案下发布了几种新的人工智能模型——首先是最新的 OpenAI o1 模型,据称该模型可以“先思考再回答”。

OpenAI 在 9 月 12 日的一篇博客文章中表示:“对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将该系列命名为 OpenAI o1。”

OpenAI 表示,新模型可以慢慢思考并使用“思路链”推理来解决复杂的任务——特别是在 STEM(科学、技术、工程和数学)和编码相关的任务中。

来源:OpenAI

这家人工智慧公司分享了 OpenAI o1 根据提示编码视讯游戏以及解决复杂逻辑难题等的影片。

OpenAI o1「预览」和「迷你」模型已向 ChatGPT Plus 订阅者提供,该公司计划在未来几个月内发布改进版本。

OpenAI 分享的数据显示 OpenAI o1 在多项基准测试中击败了 GPT-4o,包括生物、化学和物理的博士级科学主题以及一些美国高中考试。

OpenAI o1 改进模型在多个基准上与 GPT-4o 进行比较。来源:OpenAI

OpenAI 表示,由于 OpenAI o1 mini 专注于 STEM 推理能力,因此它在其狭窄关注范围之外的其他领域的知识并不丰富。

“[其]关于日期、传记和琐事等非 STEM 主题的事实知识与 GPT-4o mini 等小型法学硕士相当。”

「我们将在未来的版本中改进这些限制,并尝试将模型扩展到 STEM 以外的其他模式和专业,」它补充道。

产业专家预计 OpenAI 将在 9 月发布一款以推理为中心的人工智慧模型,代号为 Strawberry。

然而,OpenAI 并未透露正在开发的不同模型之间的差异。

杂志:100万美元赌ChatGPT不会导致AGI,苹果的智慧AI使用,AI百万富翁激增:AI Eye