PANews 6月28日消息,據財聯社報道,OpenAI新推出了一個基於GPT-4的模型——CriticGPT,用於捕獲ChatGPT代碼輸出中的錯誤。

CriticGPT的作用相當於讓人們用GPT-4來查找GPT-4的錯誤。該模型可以對ChatGPT響應結果做出批評評論,從而幫助人工智能訓練師在“基於人類反饋的強化學習(RLHF)”過程中發現的錯誤,爲人工智能訓練師提供明確的人工智能幫助。這一新模型的發佈意在向投資者傳達,OpenAI在RLHF賽道上的領先地位。RLHF的一個關鍵部分就是收集比較,讓人工智能訓練師對不同的ChatGPT回答進行評分,並反饋給ChatGPT。

研究發現,當訓練師藉助CriticGPT來審查ChatGPT輸出代碼時,他們的表現要比沒有得到幫助的人高出60%。並且,在CriticGPT的幫助下,他們的指正比自己單獨做的更加全面。