BlockBeatsによると、OpenAIは6月28日、ChatGPTコードの出力のエラーを識別するために、GPT-4に基づくCriticGPTというモデルをトレーニングしたと発表した。CriticGPTに似たモデルのRLHFへの統合が開始され、OpenAIのトレーナーに明示的なAI支援が提供される。

OpenAIは、GPT-4上のRLHFの適用規模をさらに拡大し、実用化する予定です。CriticGPTの開発は、AIモデルの効率と精度を高めるための重要な一歩です。CriticGPTは、ChatGPTコードの出力のエラーを識別することで、AIシステムの全体的なパフォーマンスと信頼性の向上に役立ちます。

CriticGPT を RLHF に統合することで、より堅牢で信頼性の高い AI トレーニング環境が提供されると期待されています。これにより、OpenAI のトレーナーの能力が向上するだけでなく、AI テクノロジーの幅広い開発と応用にも貢献します。GPT-4 での RLHF のアプリケーションの拡張は、AI テクノロジーとその実用的なアプリケーションの進歩に向けた OpenAI の継続的な取り組みの一環です。