據 BlockBeats 報道,OpenAI 推出了一種名爲 o1 的全新人工智能模型,內部代號爲“Strawberry”。與之前的科學、編碼和數學模型相比,該模型旨在處理複雜的推理任務,解決更具挑戰性的問題。在測試中,OpenAI o1 在物理、化學和生物學等具有挑戰性的基準任務中表現出與博士生相當的性能。它在數學和編碼方面也表現出色,在國際數學奧林匹克 (IMO) 資格考試中取得了 83% 的成績,大大優於僅解決了 13% 問題的 GPT-4o。在 Codeforces 比賽中,OpenAI o1 的編碼能力使其位於第 89 個百分位。
作爲早期模型,OpenAI o1 缺少 ChatGPT 的幾個有用功能,例如網頁瀏覽信息以及上傳文件和圖像的能力。短期內,GPT-4o 仍然更強大。然而,OpenAI o1 代表了處理複雜推理任務的重大進步,標誌着 AI 能力達到了新的水平。這一發展導致該系列被重新命名爲 OpenAI o1,計數器重置爲 1。該模型在各個領域都有潛在的應用:醫療研究人員可以使用 o1 註釋細胞測序數據,物理學家可以生成量子光學所需的複雜數學公式,各個領域的開發人員都可以使用 o1 構建和執行多步驟工作流程。
此外,OpenAI 還發布了 OpenAI o1-mini,這是一種速度更快、成本更低的推理模型,尤其適用於編碼。作爲一款較小的模型,o1-mini 比 o1-preview 便宜 80%,對於需要推理而無需大量世界知識的應用程序而言,它是一種強大且經濟的選擇。OpenAI 計劃向所有 ChatGPT 免費用戶提供 o1-mini 的訪問權限。