Odaily Planet Daily News OpenAI vydala svůj nejnovější vlajkový model GPT-4o, který dokáže odvodit zvuk, vidění a text v reálném čase. Hlavním konceptem je antropomorfní, nadpřirozený, osobní hlasový interaktivní asistent s ultra nízkou latencí. Podle informací souvisejících s oficiálními stránkami OpenAI a oficiálním účtem generujte jakoukoli kombinaci textového, zvukového a obrazového výstupu. Dokáže reagovat na zvukový vstup za 232 milisekund, v průměru 320 milisekund, což je podobné době reakce člověka při konverzaci. Funguje na stejné úrovni jako GPT-4 Turbo v angličtině a kódu, s významnými vylepšeními textu v neanglickém jazyce, přičemž má rychlejší a o 50 % levnější API. GPT-4o si ve srovnání se stávajícími modely vede obzvláště dobře ve vizuálním a zvukovém porozumění. Vkládání textu a obrázků se dnes zavádí do rozhraní API a ChatGPT a v nadcházejících týdnech bude vkládání hlasu a videa.