Odaily星球日報訊 OpenAI 宣佈推出具備推理能力的人工智能模型 o1,內部代號爲“草莓”。OpenAI o1 可以推理複雜的任務,並解決比之前科學、編碼和數學模型更難的問題。 在測試中,OpenAI o1 在物理、化學和生物學等具有挑戰性的基準任務上的表現與博士生類似,其在數學和編碼方面表現出色。在國際數學奧林匹克(IMO)資格考試中,GPT-4o 只正確解決了 13%的問題,而推理模型的得分爲 83%,OpenAI o1 的編碼能力在 Codeforces 競賽中達到了第 89 個百分點。 作爲早期模型 OpenAI o1 尚不具備 ChatGPT 的許多有用功能,例如瀏覽網頁以獲取信息以及上傳文件和圖像,GPT-4o 在短期內將更加強大。但對於複雜的推理任務來說,這是一個重大進步,代表了人工智能能力的新水平。 鑑於此將計數器重置爲 1,並將該系列命名爲 OpenAI o1。醫療保健研究人員可以使用 o1 來註釋細胞測序數據,物理學家可以使用 o1 生成量子光學所需的複雜數學公式,所有領域的開發人員可以使用 o1 來構建和執行多步驟工作流程。 OpenAI 還發布了 OpenAI o1-mini,這是一種經濟高效的推理模型。o1-mini 在 STEM 方面表現出色,尤其是數學和編碼——在 AIME 和 Codeforces 等評估基準上的表現幾乎與 OpenAI o1 相當。OpenAI 預計,對於需要推理而無需廣泛世界知識的應用程序,o1-mini 將是一種更快、經濟高效的模型,比 o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise 和 Edu 用戶可以使用 o1-mini 作爲 o1-preview 的替代方案,具有更高的速率限制和更低的延遲。