Według BlockBeats 28 czerwca OpenAI poinformowało, że wytrenowało model CriticGPT oparty na GPT-4 o nazwie CriticGPT w celu wychwytywania błędów w kodzie wyjściowym ChatGPT. OpenAI zaczyna integrować modele podobne do CriticGPT do swojego RLHF, zapewniając wyraźną pomoc AI trenerom OpenAI. OpenAI planuje dalsze rozszerzanie skali zastosowań RLHF na GPT-4 i wdrażanie go w praktyce.