OpenAI 在修改後的命名方案下發布了幾種新的人工智能模型——首先是最新的 OpenAI o1 模型,據稱該模型可以“先思考再回答”。
OpenAI 在 9 月 12 日的一篇博客文章中表示:“對於複雜的推理任務來說,這是一個重大進步,代表了人工智能能力的新水平。鑑於此,我們將計數器重置爲 1,並將該系列命名爲 OpenAI o1。”
OpenAI 表示,新模型可以慢慢思考並使用“思路鏈”推理來解決複雜的任務——特別是在 STEM(科學、技術、工程和數學)和編碼相關的任務中。
來源:OpenAI
這家人工智慧公司分享了 OpenAI o1 根據提示編碼視訊遊戲以及解決複雜邏輯難題等的影片。
OpenAI o1「預覽」和「迷你」模型已向 ChatGPT Plus 訂閱者提供,該公司計劃在未來幾個月內發布改進版本。
OpenAI 分享的數據顯示 OpenAI o1 在多項基準測試中擊敗了 GPT-4o,包括生物、化學和物理的博士級科學主題以及一些美國高中考試。
OpenAI o1 改進模型在多個基準上與 GPT-4o 進行比較。來源:OpenAI
OpenAI 表示,由於 OpenAI o1 mini 專注於 STEM 推理能力,因此它在其狹窄關注範圍之外的其他領域的知識並不豐富。
“[其]關於日期、傳記和瑣事等非 STEM 主題的事實知識與 GPT-4o mini 等小型法學碩士相當。”
「我們將在未來的版本中改進這些限制,並嘗試將模型擴展到 STEM 以外的其他模式和專業,」它補充道。
產業專家預計 OpenAI 將在 9 月發布一款以推理為中心的人工智慧模型,代號為 Strawberry。
然而,OpenAI 並未透露正在開發的不同模型之間的差異。
雜誌:100萬美元賭ChatGPT不會導致AGI,蘋果的智慧AI使用,AI百萬富翁激增:AI Eye