OpenAI uvedlo zcela nový model odvozování o3, který dosáhl průlomového výsledku 75,7 % v testu ARC-AGI, a zavedlo technologii "opatrného sladění" pro zvýšení bezpečnosti modelu. Tento model je nyní otevřen pro žádosti o bezpečnostní testy a očekává se, že bude oficiálně vydán na začátku roku 2025. (Předchozí informace: Nástroj pro generování videí OpenAI Sora byl oficiálně spuštěn! 5 hlavních funkcí, předplatné schémata na jednom místě) (Doplňující informace: OpenAI vydalo plnohodnotnou verzi modelu o1 a nový předplatitelský plán ChatGPT Pro, stojí měsíční poplatek 200 dolarů za to?) Vývojář ChatGPT, OpenAI, po 12 dnech prezentací nových produktů včera (20.) dospěl k závěru, přičemž vrcholnou prezentací je zcela nový model odvozování "o3" a "o3-mini", tento AI model má silnější schopnosti odvozování a je určen k řešení složitých úkolů vyžadujících postupné logické odvozování. Dnes jsme sdíleli hodnocení pro ranou verzi dalšího modelu v naší sérii modelů odvozování o-model: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20. prosince 2024 Vlastnosti modelu 1) Schopnosti odvozování dosáhly SoTA výkonu OpenAI uvedlo, že model o3 se v několika benchmarkových testech osvědčil, včetně složitých programovacích, matematických a vědeckých problémů, což ukazuje na jeho silné logické odvozovací schopnosti. V hodnocení "ARC-AGI", které vyvinul Alignment Research Center (ARC) k testování schopností obecné umělé inteligence (AGI) AI systémů, dosáhl model o3 v některých neveřejných testech průlomového výsledku 75,7 %, což představuje nový technologický vrchol (State of the Art, SoTA). Kromě toho dosáhla vysoce výpočetně náročná verze (high-compute configuration) modelu o3 v tomtéž testu ještě vyššího výsledku 87,5 %, ale pravděpodobně kvůli nárokům na zdroje, které přesahují standard, se nedostala do kvalifikace pro ARC-AGI-Pub (veřejně ověřitelné výsledky testů ARC-AGI). Nové ověřené ARC-AGI-Pub SoTA! @OpenAI o3 dosáhl průlomového výsledku 75,7 % v hodnocení ARC-AGI Semi-Private. A vysoce výpočně náročná konfigurace o3 (nepřístupná pro ARC-AGI-Pub) dosáhla 87,5 % v Semi-Private Eval. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20. prosince 2024 2) Více verzí k dispozici OpenAI nabízí dvě verze o3 a o3-mini, přičemž druhá je plánována na konec ledna 2025, kompletní verze o3 bude následně vydána (konkrétní datum nebylo zveřejněno). Tento nový model využívá nedávno zavedené API Adaptive Thinking Time, které nabízí tři různé režimy odvozování: nízký, střední a vysoký. Tato funkce umožňuje uživatelům přizpůsobit délku "myšlení" modelu před odpovědí na otázky podle potřeby. Z níže uvedeného obrázku je patrné, že o3-mini dosahuje v odvozovacích výsledcích srovnatelnosti s aktuálním modelem o1, ale výrazně snižuje provozní náklady. 3) Posílená bezpečnost OpenAI zavedlo novou tréninkovou metodu "opatrného sladění (Deliberative alignment)", která přímo učí velké jazykové modely (LLMs) rozumět lidským psaným, srozumitelným bezpečnostním normám a před odpovědí na otázky zajistit dodržování těchto norem během odvozování. OpenAI ve svém prohlášení uvedlo: "Díky této metodě jsme úspěšně optimalizovali modely série o OpenAI tak, aby mohly používat techniku odvozování 'myšlenkového řetězce' (Chain-of-Thought, CoT), reflektovat otázky uživatelů, identifikovat související normativní texty v interních politikách OpenAI a generovat bezpečnější odpovědi." Pojmenování stojí za zmínku, že OpenAI přeskočilo pojmenování "o2" a přímo použilo "o3". Generální ředitel Sam Altman vysvětlil, že to bylo uděláno, aby se předešlo záměně s britským telekomunikačním poskytovatelem O2 a zároveň ukázalo jedinečný smysl pro humor OpenAI. Ve vysílání uvedl: "Z úcty k Telefónica (mateřské společnosti O2) a k udržení dobré tradice OpenAI být velmi neschopní v pojmenovávání jsme to nazvali o3." Pozvání pro výzkumníky k účasti na bezpečnostních testech V současnosti jsou modely o3 a o3-mini ve fázi interního bezpečnostního testování, OpenAI otevřelo žádosti a vyzvalo externí výzkumníky k účasti na bezpečnostních testech. Žádosti budou uzavřeny 10. ledna 2025. Co se týče uvedení tohoto modelu, Sam Altman se bez skromnosti vyjádřil, že to označuje oficiální přechod AI vývoje do "další fáze". Ohlédnutí za letošním rokem, kdy Bloomberg odhalil AI klasifikační systém OpenAI, další fáze po chatbotu a modelech odvozování jsou Agents - pokročilé AI systémy, které mohou jednat jménem uživatelů. To je právě to, co se v současnosti zkoumá a vyvíjí v oblasti kryptoměn i Web2. Klasifikační systém AI OpenAI. Zdroj obrázku: Bloomberg