块链消息,9月13日,据OpenAI官方博客报道,OpenAI推出了具有推理能力的人工智能模型o1,代号为“草莓”。OpenAI o1可以推理复杂任务,解决比以往的科学、编码和数学模型更困难的问题。在测试中,OpenAI o1在物理、化学和生物等具有挑战性的基准任务上的表现与博士生相似,在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o仅正确解决了13%的问题,而推理模型得分为83%,OpenAI o1的编码能力在Codeforces比赛中达到了第89百分位。

作为早期模型,OpenAI o1 尚不具备 ChatGPT 的许多有用功能,例如浏览网页获取信息以及上传文件和图像。GPT-4o 在短期内会更加强大。但对于复杂的推理任务而言,这是一个重大改进,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将该系列命名为 OpenAI o1。医疗保健研究人员可以使用 o1 注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,各个领域的开发人员都可以使用 o1 构建和执行多步骤工作流程。

OpenAI 还发布了 OpenAI o1-mini,这是一种速度更快、成本更低的推理模型,在编码方面效率特别高。作为一款较小的模型,o1-mini 比 o1-preview 便宜 80%,这使其成为一款功能强大且经济高效的模型,适用于需要推理但不需要大量世界知识的应用。OpenAI 计划向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。