BlockBeats によると、6 月 28 日、OpenAI は、ChatGPT コード出力のエラーを捕捉するために CriticGPT と呼ばれる GPT-4 ベースのモデルをトレーニングしたと発表しました。 OpenAI は、CriticGPT に似たモデルを RLHF に統合し始めており、OpenAI のトレーナーに明示的な AI 支援を提供しています。 OpenAIはGPT-4上のRLHFの適用規模をさらに拡大し、実用化する予定だ。