OpenAI發佈新一代大模型o1，具有推理能力、在數學和編碼方面表現更出色

Odaily星球日報訊 OpenAI 宣佈推出具備推理能力的人工智能模型 o1，內部代號爲“草莓”。OpenAI o1 可以推理複雜的任務，並解決比之前科學、編碼和數學模型更難的問題。 在測試中，OpenAI o1 在物理、化學和生物學等具有挑戰性的基準任務上的表現與博士生類似，其在數學和編碼方面表現出色。在國際數學奧林匹克（IMO）資格考試中，GPT-4o 只正確解決了 13%的問題，而推理模型的得分爲 83%，OpenAI o1 的編碼能力在 Codeforces 競賽中達到了第 89 個百分點。 作爲早期模型 OpenAI o1 尚不具備 ChatGPT 的許多有用功能，例如瀏覽網頁以獲取信息以及上傳文件和圖像，GPT-4o 在短期內將更加強大。但對於複雜的推理任務來說，這是一個重大進步，代表了人工智能能力的新水平。 鑑於此將計數器重置爲 1，並將該系列命名爲 OpenAI o1。醫療保健研究人員可以使用 o1 來註釋細胞測序數據，物理學家可以使用 o1 生成量子光學所需的複雜數學公式，所有領域的開發人員可以使用 o1 來構建和執行多步驟工作流程。 OpenAI 還發布了 OpenAI o1-mini，這是一種經濟高效的推理模型。o1-mini 在 STEM 方面表現出色，尤其是數學和編碼——在 AIME 和 Codeforces 等評估基準上的表現幾乎與 OpenAI o1 相當。OpenAI 預計，對於需要推理而無需廣泛世界知識的應用程序，o1-mini 將是一種更快、經濟高效的模型，比 o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise 和 Edu 用戶可以使用 o1-mini 作爲 o1-preview 的替代方案，具有更高的速率限制和更低的延遲。

OpenAI發佈新一代大模型o1，具有推理能力、在數學和編碼方面表現更出色

創作者的更多內容

實時新聞

OpenAI發佈新一代大模型o1，具有推理能力、在數學和編碼方面表現更出色

創作者的更多內容

實時新聞

熱門文章