OpenAI launches CriticGPT model, allowing GPT-4 to help humans train GPT-4

PANews · 2024-06-28T14:13:02.000Z

PANews reported on June 28 that according to Cailianshe, OpenAI has launched a new GPT-4-based model - CriticGPT, which is used to capture errors in ChatGPT code output. CriticGPT is equivalent to letting people use GPT-4 to find GPT-4 errors. The model can make critical comments on ChatGPT response results, thereby helping AI trainers find errors in the "Reinforcement Learning Based on Human Feedback (RLHF)" process, providing clear AI assistance to AI trainers. The release of this new model is intended to convey to investors that OpenAI is leading the RLHF track. A key part of RLHF is to collect comparisons, allowing AI trainers to score different ChatGPT answers and feed them back to ChatGPT.

OpenAI spouští model CriticGPT, který umožňuje GPT-4 pomáhat lidem trénovat GPT-4

LIVE

PANews

--・166 views

PANews 28. června informovalo, že OpenAI spustila nový model založený na GPT-4 – CriticGPT, který se používá k zachycení chyb ve výstupu kódu ChatGPT.
CriticGPT je ekvivalentní tomu, jako nechat lidi používat GPT-4 k nalezení chyb GPT-4. Model může kriticky komentovat výsledky odezvy ChatGPT, čímž pomáhá školiteli AI poskytovat explicitní pomoc AI pro chyby nalezené během procesu „učení na základě lidské zpětné vazby (RLHF)“. Vydání tohoto nového modelu má investorům zprostředkovat vedoucí pozici OpenAI na trati RLHF. Klíčovou součástí RLHF je shromažďování srovnání, což umožňuje trenérům umělé inteligence skórovat různé odpovědi ChatGPT a zpětnou vazbu k ChatGPT.
Studie zjistila, že když školitelé použili CriticGPT ke kontrole výstupního kódu ChatGPT, vedli o 60 % lépe než ti, kteří pomoc nedostali. Navíc s pomocí CriticGPT jsou jejich opravy komplexnější než to, co by mohli udělat sami.

Vyloučení odpovědnosti: Obsahuje názory třetích stran. Nejedná se o finanční poradenství. Může obsahovat sponzorovaný obsah. Viz obchodní podmínky.

OpenAI spouští model CriticGPT, který umožňuje GPT-4 pomáhat lidem trénovat GPT-4

Prozkoumat více od tvůrce

Nejnovější zprávy