Odaily Planet Daily News OpenAI a lansat cel mai recent model GPT-4o, care poate deduce audio, viziune și text în timp real. Conceptul principal este un asistent vocal interactiv antropomorf, supranatural, cu latență ultra scăzută. Conform informațiilor de pe site-ul web oficial al OpenAI și din contul oficial al Generați orice combinație de text, audio și imagine. Poate răspunde la intrarea audio în 232 de milisecunde, cu o medie de 320 de milisecunde, similar timpilor de reacție uman în conversație. Funcționează la egalitate cu GPT-4 Turbo în limba engleză și cod, cu îmbunătățiri semnificative asupra textului în limba non-engleză, având în același timp un API mai rapid și cu 50% mai ieftin. GPT-4o are rezultate deosebit de bune în înțelegerea vizuală și audio în comparație cu modelele existente. Introducerea textului și a imaginilor se lansează astăzi în API și ChatGPT, iar introducerea vocală și video va veni în săptămânile următoare.