Según BlockBeats, el 28 de junio, OpenAI dijo que había entrenado un modelo basado en GPT-4 llamado CriticGPT para capturar errores en la salida del código ChatGPT. OpenAI está comenzando a integrar modelos similares a CriticGPT en su RLHF, brindando asistencia explícita de IA a los capacitadores de OpenAI. OpenAI planea ampliar aún más la escala de aplicación de RLHF en GPT-4 y ponerlo en práctica.