PANews 28. června informovalo, že OpenAI spustila nový model založený na GPT-4 – CriticGPT, který se používá k zachycení chyb ve výstupu kódu ChatGPT.

CriticGPT je ekvivalentní tomu, jako nechat lidi používat GPT-4 k nalezení chyb GPT-4. Model může kriticky komentovat výsledky odezvy ChatGPT, čímž pomáhá školiteli AI poskytovat explicitní pomoc AI pro chyby nalezené během procesu „učení na základě lidské zpětné vazby (RLHF)“. Vydání tohoto nového modelu má investorům zprostředkovat vedoucí pozici OpenAI na trati RLHF. Klíčovou součástí RLHF je shromažďování srovnání, což umožňuje trenérům umělé inteligence skórovat různé odpovědi ChatGPT a zpětnou vazbu k ChatGPT.

Studie zjistila, že když školitelé použili CriticGPT ke kontrole výstupního kódu ChatGPT, vedli o 60 % lépe než ti, kteří pomoc nedostali. Navíc s pomocí CriticGPT jsou jejich opravy komplexnější než to, co by mohli udělat sami.