Segundo BlockBeats, a OpenAI anunciou no dia 28 de junho que treinou um modelo baseado em GPT-4, denominado CriticGPT, para identificar erros na saída do código ChatGPT. A integração de modelos semelhantes ao CriticGPT em seu RLHF já começou, fornecendo assistência explícita de IA aos treinadores da OpenAI.

A OpenAI planeja expandir ainda mais a escala de aplicação do RLHF no GPT-4 e colocá-lo em prática. O desenvolvimento do CriticGPT é um passo significativo no aumento da eficiência e precisão dos modelos de IA. Ao identificar erros na saída do código ChatGPT, o CriticGPT pode ajudar a melhorar o desempenho geral e a confiabilidade dos sistemas de IA.

Espera-se que a integração do CriticGPT no RLHF forneça um ambiente de treinamento de IA mais robusto e confiável. Isto não só melhorará as capacidades dos formadores da OpenAI, mas também contribuirá para o desenvolvimento e aplicação mais amplos de tecnologias de IA. A expansão da aplicação RLHF no GPT-4 faz parte dos esforços contínuos da OpenAI para avançar a tecnologia de IA e suas aplicações práticas.