OpenAI 在新產品活動發布 Day2 釋出「強化學習微調」(Reinforcement Fine-Tuning,RFT) 功能,讓用戶能夠在客製化模型在個別領域的推理能力,進而提高模型的準確率,並且這一功能可以沿用在許多領域上,包括科學研究、法律、金融、保險、工程等等。 (前情提要:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? ) (背景補充:OpenAI 宣佈將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏? ) ChatGPT 背後開發商 OpenAI 在 5 日預告,將於 6 日凌晨 2 點開始進行為期 12 天的新產品發布。首日登場的是完整版推理模型 o1,取代先前的預覽版本,目前 ChatGPT Plus、Team 和 Pro 用戶已可以使用,同時還推出可以無限制使用 o1 模型的訂閱方案 ——「ChatGPT Pro」。 延伸閱讀:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? 而今(7)日是活動 Day2,OpenAI 準備了哪些驚喜給我們呢? 釋出新功能「強化學習微調」 在第二天的產品發佈中,OpenAI 釋出新功能「強化學習微調」(Reinforcement Fine-Tuning,RFT),讓用戶能夠使用自己的數據集,透過強化學習演算法對 o1 模型進行客製化訓練。另外,活動主持人表示,強化學習微調僅需數十個高品質範例便可迅速提升模型在該特定領域的推理能力。 值得一提的是,這一功能可以沿用在許多領域上,包括科學研究、法律、金融、保險、工程等等。 另外,在發布影片中,柏克萊國家實驗室計算生物學家 Justin Reese 也參與了模型的現場演示,分享「強化學習微調」是如何幫助診斷罕見疾病。 在 Reese 展示的圖片中可以看到,o1 模型原先的識別準確率為 25 %;o1 mini 模型原先的識別準確率為 17%,而在強化學習微調後的 o1 mini 模型準確率提升至 31 %,準確率增幅達到 82% 。 雖然「強化學習微調」功能大幅提升模型在特定領域的準確度與專業性,不過主持人也表示,目前強化學習微調功能仍處於預覽階段,計劃於明年向大眾推出。另外, OpenaAI 目前已啟動 RFT alpha 計畫,號召大學、研究機構或企業等單位參與此項功能的測試。 相關報導 ChatGPT被爆「拒絕回復David Mayer」等人名,OpenAI遭疑刻意封鎖資訊 OpenAI 宣佈將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏? OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? "OpenAI發表Day2)逆天「強化學習微調」新功能,增強AI專業領域學習準確度"這篇文章最早發佈於動區BlockTempo(動區動趨-最具影響力的區塊鏈新聞媒體)。