塊鏈消息,9月13日,據OpenAI官方博客報道,OpenAI推出了具有推理能力的人工智能模型o1,代號爲“草莓”。OpenAI o1可以推理複雜任務,解決比以往的科學、編碼和數學模型更困難的問題。在測試中,OpenAI o1在物理、化學和生物等具有挑戰性的基準任務上的表現與博士生相似,在數學和編碼方面表現出色。在國際數學奧林匹克(IMO)資格考試中,GPT-4o僅正確解決了13%的問題,而推理模型得分爲83%,OpenAI o1的編碼能力在Codeforces比賽中達到了第89百分位。

作爲早期模型,OpenAI o1 尚不具備 ChatGPT 的許多有用功能,例如瀏覽網頁獲取信息以及上傳文件和圖像。GPT-4o 在短期內會更加強大。但對於複雜的推理任務而言,這是一個重大改進,代表了人工智能能力的新水平。鑑於此,我們將計數器重置爲 1,並將該系列命名爲 OpenAI o1。醫療保健研究人員可以使用 o1 註釋細胞測序數據,物理學家可以使用 o1 生成量子光學所需的複雜數學公式,各個領域的開發人員都可以使用 o1 構建和執行多步驟工作流程。

OpenAI 還發布了 OpenAI o1-mini,這是一種速度更快、成本更低的推理模型,在編碼方面效率特別高。作爲一款較小的模型,o1-mini 比 o1-preview 便宜 80%,這使其成爲一款功能強大且經濟高效的模型,適用於需要推理但不需要大量世界知識的應用。OpenAI 計劃向所有 ChatGPT 免費用戶提供 o1-mini 的訪問權限。