OpenAI推出o3模型！推理能力再推高等級，為下一代AI鋪路

OpenAI推出全新推理模型o3，以突破性75.7%的ARC-AGI測試成績刷新紀錄，並引入「審慎對齊」技術，加強模型安全性。該模型目前開放安全測試申請，預計2025年初正式發布。（前情提要：OpenAI影片生成工具Sora正式上線！5大功能亮點、訂閱方案一次看）（背景補充：OpenAI發表滿血版o1模型和新訂閱方案ChatGPT Pro，月費200美元值得嗎？）ChatGPT背後開發商OpenAI連續12天新品發表於昨（20）日迎來尾聲，壓軸登場的是全新的推理模型「o3」和「o3-mini」，這款AI模型擁有更強的推理能力，旨在解決需要逐步邏輯推理的複雜任務。Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) December 20, 2024模型特點1)推理能力創下SoTA成績OpenAI聲明指出，o3模型在多項基準測試中表現優異，包括複雜的編程、數學和科學問題，顯示出其強大的邏輯推理能力。在由Alignment Research Center (ARC)開發，用於測試AI系統通用人工智慧（AGI）能力的「ARC-AGI」評估中，o3在部分非公開測試中取得了75.7%的突破性成績，創下技術新高度（State of the Art, SoTA）。此外，一個高計算資源版本（high-compute configuration）的o3在相同測試中達成了更高的87.5%成績，但可能由於該版本資源要求超出標準，未能符合ARC-AGI-Pub（公開可驗證ARC-AGI測試結果）的資格。New verified ARC-AGI-Pub SoTA! @OpenAI o3 has scored a breakthrough 75.7% on the ARC-AGI Semi-Private Evaluation. And a high-compute o3 configuration (not eligible for ARC-AGI-Pub) scored 87.5% on the Semi-Private Eval. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) December 20, 2024 2)多版本選擇OpenAI提供了o3和o3-mini兩個版本，後者預計於2025年1月底推出，完整版o3將隨後發布（並未公布具體時間）。這款新模型採用了OpenAI最近推出的自適應思考時間（Adaptive Thinking Time）API，提供低、中、高三種不同的推理模式。該功能允許使用者根據需求調整模型在回答問題前的「思考」時間長度。從下圖可以看出，o3-mini在推理結果上能與目前的o1模型相媲美，但在運算成本方面則顯著降低。3)安全性強化OpenAI採用了新的「審慎對齊（Deliberative alignment）」訓練方法，直接教導大型語言模型（LLMs）理解人類撰寫的、可解釋的安全規範，並在回答問題之前確保遵守這些規範進行推理。OpenAI在聲明中表示：通過這種方法，我們成功對OpenAI的o系列模型進行了優化，使其能使用「思維鏈」（Chain-of-Thought, CoT）推理技術，反思使用者的提問，找出OpenAI內部政策中相關的規範文本，從而生成更安全的回應。命名由來值得一提的是，OpenAI跳過了「o2」的命名，直接使用了「o3」。執行長Sam Altman解釋，這是為了避免與英國電信供應商O2產生混淆，同時展現了OpenAI獨特的幽默感。他在直播中表示：「出於對Telefónica（O2的母公司）的尊重，以及延續OpenAI極度不擅長取名的優良傳統，我們將它命名為o3。」邀請研究人員參與安全測試目前，o3和o3-mini正處於內部安全測試階段，OpenAI已開放申請，邀請外部研究人員參與安全測試。申請將於2025年1月10日截止。對於該模型的推出，Sam Altman毫不謙虛地表示，這標誌著AI發展正式進入「下一階段」。回顧今年中彭博爆料OpenAI的AI分級表，在聊天機器人和推理模型後的下一階段便是Agents——能代表使用者採取行動的先進AI系統。這正是當前無論是加密貨幣市場還是Web2領域，都在全力探索與開發的重點方向。OpenAI的AI分級系統劃分。圖源：彭博相關報導OpenAI發表Day2)逆天「強化學習微調」新功能，增強AI專業領域學習準確度OpenAI宣布將連續12天直播：推出許多新功能，AI概念幣可埋伏？OpenAI政治博弈失利，Sam Altman將難敵馬斯克與川普的「AI同盟」？ "OpenAI推出o3模型！推理能力再推高等級，為下一代AI鋪路"這篇文章最早發佈於動區BlockTempo(動區動趨-最具影響力的區塊鏈新聞媒體)。
OpenAI推出o3模型！推理能力再推高等級，為下一代AI鋪路

Explore mais do Criador

Últimas Notícias