Odaily Planet Daily News OpenAI merilis model andalan terbarunya GPT-4o, yang dapat menyimpulkan audio, penglihatan, dan teks secara real-time. Konsep utamanya adalah asisten interaktif suara pribadi yang antropomorfik, supernatural, dan berlatensi sangat rendah. Menurut informasi terkait situs resmi OpenAI dan akun resmi Hasilkan kombinasi teks, audio, dan keluaran gambar apa pun. Ia dapat merespons input audio dalam 232 milidetik, dengan rata-rata 320 milidetik, mirip dengan waktu reaksi manusia dalam percakapan. Performanya setara dengan GPT-4 Turbo dalam bahasa Inggris dan kode, dengan peningkatan signifikan pada teks bahasa non-Inggris, sekaligus memiliki API yang lebih cepat dan 50% lebih murah. GPT-4o memiliki kinerja yang sangat baik dalam pemahaman visual dan audio dibandingkan model yang sudah ada. Input teks dan gambar diluncurkan ke API dan ChatGPT hari ini, dengan input suara dan video akan hadir dalam beberapa minggu mendatang.