查看原文

OpenAI推出CriticGPT模型，讓GPT-4幫人類訓練GPT-4

--・166 views

PANews 6月28日消息，據財聯社報道，OpenAI新推出了一個基於GPT-4的模型——CriticGPT，用於捕獲ChatGPT代碼輸出中的錯誤。
CriticGPT的作用相當於讓人們用GPT-4來查找GPT-4的錯誤。該模型可以對ChatGPT響應結果做出批評評論，從而幫助人工智能訓練師在“基於人類反饋的強化學習（RLHF）”過程中發現的錯誤，爲人工智能訓練師提供明確的人工智能幫助。這一新模型的發佈意在向投資者傳達，OpenAI在RLHF賽道上的領先地位。RLHF的一個關鍵部分就是收集比較，讓人工智能訓練師對不同的ChatGPT回答進行評分，並反饋給ChatGPT。
研究發現，當訓練師藉助CriticGPT來審查ChatGPT輸出代碼時，他們的表現要比沒有得到幫助的人高出60%。並且，在CriticGPT的幫助下，他們的指正比自己單獨做的更加全面。

免責聲明：包含來自第三方的見解。非財務建議。可能包含贊助內容。請參閱條款。