Menurut BlockBeats, OpenAI mengumumkan pada tanggal 28 Juni bahwa mereka telah melatih model berbasis GPT-4, bernama CriticGPT, untuk mengidentifikasi kesalahan dalam keluaran kode ChatGPT. Integrasi model yang mirip dengan CriticGPT ke dalam RLHF mereka telah dimulai, memberikan bantuan AI secara eksplisit kepada pelatih OpenAI.

OpenAI berencana untuk lebih memperluas skala penerapan RLHF pada GPT-4 dan mempraktikkannya. Pengembangan CriticGPT merupakan langkah signifikan dalam meningkatkan efisiensi dan akurasi model AI. Dengan mengidentifikasi kesalahan dalam keluaran kode ChatGPT, CriticGPT dapat membantu meningkatkan kinerja dan keandalan sistem AI secara keseluruhan.

Integrasi CriticGPT ke dalam RLHF diharapkan dapat menyediakan lingkungan pelatihan AI yang lebih kuat dan andal. Hal ini tidak hanya akan meningkatkan kemampuan para pelatih OpenAI tetapi juga berkontribusi pada pengembangan dan penerapan teknologi AI yang lebih luas. Perluasan penerapan RLHF pada GPT-4 merupakan bagian dari upaya berkelanjutan OpenAI untuk memajukan teknologi AI dan penerapan praktisnya.