Pencipta ChatGPT, OpenAI, telah mengumumkan model AI terbarunya, GPT-4o, chatbot AI yang lebih cerewet dan lebih mirip manusia, yang dapat menafsirkan audio dan video pengguna serta merespons secara real-time.

Serangkaian demo yang dirilis oleh perusahaan tersebut menunjukkan GPT-4 Omni membantu calon pengguna dengan hal-hal seperti persiapan wawancara — dengan memastikan mereka terlihat rapi untuk wawancara — dan menelepon agen layanan pelanggan untuk mendapatkan iPhone pengganti, menerjemahkan percakapan bilingual secara nyata. waktu.

Demo menunjukkan bahwa ia dapat berbagi lelucon ayah, menjadi juri pertandingan batu-kertas-gunting antara dua pengguna, dan merespons dengan sarkasme ketika ditanya. Salah satu demo bahkan menunjukkan ChatGPT diperkenalkan kepada anak anjing pengguna untuk pertama kalinya.

"Halo, Bowser! Bukankah kamu adalah makhluk kecil yang paling menggemaskan?" seru chatbot itu.

Sampaikan salam kepada GPT-4o, model andalan baru kami yang dapat menganalisis audio, penglihatan, dan teks secara real-time: https://t.co/MYHZB79UqNInput teks dan gambar diluncurkan hari ini di API dan ChatGPT dengan suara dan video di beberapa minggu mendatang. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) 13 Mei 2024

“Rasanya seperti AI di film; dan masih sedikit mengejutkan bagi saya bahwa hal ini nyata,” kata CEO perusahaan tersebut, Sam Altman, dalam postingan blog tanggal 13 Mei.

“Mencapai waktu respons dan ekspresi yang setara dengan manusia ternyata merupakan perubahan besar.”

Versi input teks dan gambar saja diluncurkan pada 13 Mei, dengan versi lengkap akan diluncurkan dalam beberapa minggu mendatang, OpenAI mengatakan dalam postingan X baru-baru ini.

GPT-4o akan tersedia untuk pengguna ChatGPT berbayar dan gratis dan dapat diakses dari API ChatGPT.

OpenAI mengatakan “o” di GPT-4o adalah singkatan dari “omni” – yang berupaya menandai langkah menuju interaksi manusia-komputer yang lebih alami.

Memperkenalkan GPT-4o, model baru kami yang dapat menganalisis teks, audio, dan video secara real-time. Model ini sangat serbaguna, menyenangkan untuk dimainkan, dan merupakan langkah menuju bentuk interaksi manusia-komputer (dan bahkan manusia) yang jauh lebih alami. -interaksi komputer-komputer): pic.twitter.com/VLG7TJ1JQx

— Greg Brockman (@gdb) 13 Mei 2024

Kemampuan GPT-4o untuk memproses input teks, audio, dan gambar apa pun secara bersamaan merupakan kemajuan besar dibandingkan alat AI OpenAI sebelumnya, seperti ChatGPT-4, yang sering kali “kehilangan banyak informasi” saat dipaksa melakukan banyak tugas. .

Terkait: Apple menyelesaikan kesepakatan dengan OpenAI untuk integrasi iPhone ChatGPT: Laporan

OpenAI mengatakan “GPT-4o lebih baik dalam hal penglihatan dan pemahaman audio dibandingkan model yang sudah ada,” bahkan mencakup menangkap emosi dan pola pernapasan pengguna.

Ini juga “jauh lebih cepat” dan “50% lebih murah” dibandingkan GPT-4 Turbo di API OpenAI.

Alat AI baru ini dapat merespons input audio hanya dalam 2,3 detik, dengan waktu rata-rata 3,2 detik, klaim OpenAI, yang diklaim serupa dengan waktu respons manusia dalam percakapan biasa.

Majalah: ​​Cara menghentikan kiamat kecerdasan buatan: David Brin, penulis Uplift