Vývojář umělé inteligence OpenAI vstoupil do října s několika aktualizacemi svých modelů, které pomohly modelům umělé inteligence zapojit se do lepší konverzace a zlepšit rozpoznávání obrázků.

1. října OpenAI odhalila čtyři aktualizace, které zavádějí nové nástroje navržené tak, aby usnadnily vývojářům stavět na jejích modelech AI.

To mluví!

Jednou z hlavních aktualizací je rozhraní Realtime API, které umožňuje vývojářům vytvářet hlasové aplikace generované umělou inteligencí pomocí jediné výzvy.  

Nástroj, který je k dispozici pro testování, podporuje multimodální zážitky s nízkou latencí streamováním zvukových vstupů a výstupů, což umožňuje přirozené konverzace podobné pokročilému hlasovému režimu ChatGPT. 

Dříve museli vývojáři „spojit dohromady“ několik modelů, aby vytvořili tyto zážitky. Zvukový vstup by obvykle musel být před přijetím odpovědi plně nahrán a zpracován, což znamenalo vyšší latenci pro aplikace v reálném čase, jako jsou konverzace řeči na řeč. 

S funkcí streamování Realtime API mohou nyní vývojáři umožnit okamžité, přirozené interakce, podobně jako hlasové asistenty. Rozhraní API běží na GPT-4, vydaném v květnu 2024, které dokáže v reálném čase uvažovat napříč zvukem, obrazem a textem.

AI teď vidí jasně

Další aktualizace obsahuje nástroj pro jemné doladění pro vývojáře, který jim umožňuje zlepšit reakce umělé inteligence generované z obrázků a textových vstupů. 

Jemné ladičky založené na obrazech umožňují umělé inteligenci, aby měla lepší schopnost porozumět obrázkům, což podle vývojáře zlepšuje vizuální vyhledávání a schopnosti detekce objektů. Proces zahrnuje zpětnou vazbu od lidí, kteří poskytují příklady dobrých a špatných reakcí.

Kromě aktualizací hlasu a vidění OpenAI také zavedlo „destilaci modelu“ a „rychlé ukládání do mezipaměti“, které umožňují menším modelům učit se od větších a snižují náklady a čas na vývoj opětovným použitím již zpracovaného textu. 

Pokročilé možnosti jejích modelů jsou klíčovým prodejním argumentem, protože hlavní část příjmů pro OpenAI pochází z podniků, které vytvářejí své vlastní aplikace na technologii OpenAI. 

Podle agentury Reuters odhaduje OpenAI v příštím roce nárůst tržeb na 11,6 miliardy dolarů z odhadovaných 3,7 miliardy dolarů v roce 2024.

Magazín: Umělá inteligence již možná využívá více energie než bitcoin – a ohrožuje těžbu bitcoinů