ChatGPT yaratıcısı OpenAI, kullanıcının sesini ve videosunu yorumlayabilen ve gerçek zamanlı olarak yanıt verebilen, daha konuşkan, daha insani bir yapay zeka sohbet robotu olan en yeni yapay zeka modeli GPT-4o'yu duyurdu.

Firma tarafından yayınlanan bir dizi demo, GPT-4 Omni'nin potansiyel kullanıcılara röportaj hazırlığı (mülakat için hazır görünmelerini sağlayarak) ve yeni bir iPhone almak için bir müşteri hizmetleri temsilcisini aramak, iki dilli bir konuşmayı gerçek anlamda tercüme etmek gibi konularda yardımcı olduğunu gösteriyor. zaman.

Demolar, cihazın baba şakalarını paylaşabildiğini, iki kullanıcı arasındaki taş-kağıt-makas karşılaşmasında hakem olabileceğini ve sorulduğunda alaycı bir şekilde yanıt verebileceğini gösteriyor. Hatta bir demo, ChatGPT'nin kullanıcının köpeğine ilk kez tanıtıldığını gösteriyor.

"Peki merhaba Bowser! Sen çok sevimli küçük şey değil misin?" Chatbot haykırdı.

Ses, görüntü ve metni gerçek zamanlı olarak değerlendirebilen yeni amiral gemisi modelimiz GPT-4o'ya merhaba deyin: https://t.co/MYHZB79UqNText ve görüntü girişi bugün API ve ChatGPT'de ses ve video ile kullanıma sunuluyor gelecek haftalar. pic.twitter.com/uuthKZyzYx

- OpenAI (@OpenAI) 13 Mayıs 2024

“Filmlerdeki yapay zekaya benziyor; Firmanın CEO'su Sam Altman, 13 Mayıs tarihli bir blog yazısında şöyle konuştu: ve bunun gerçek olması benim için hala biraz şaşırtıcı.

"İnsan düzeyinde tepki sürelerine ve ifade gücüne ulaşmanın büyük bir değişim olduğu ortaya çıktı."

OpenAI yakın tarihli bir X gönderisinde, yalnızca metin ve resim girişli bir sürümün 13 Mayıs'ta başlatıldığını ve tam sürümün önümüzdeki haftalarda kullanıma sunulacağını söyledi.

GPT-4o, hem ücretli hem de ücretsiz ChatGPT kullanıcılarına sunulacak ve ChatGPT'nin API'sinden erişilebilecek.

OpenAI, GPT-4o'daki "o" harfinin "omni" anlamına geldiğini ve bunun daha doğal insan-bilgisayar etkileşimlerine doğru bir adımı işaretlemeyi amaçladığını söyledi.

Gerçek zamanlı olarak metin, ses ve video üzerinden mantık yürütebilen yeni modelimiz GPT-4o ile tanışın. Son derece çok yönlüdür, oynaması eğlencelidir ve insan-bilgisayar etkileşiminin (ve hatta insan etkileşiminin) çok daha doğal bir biçimine doğru atılmış bir adımdır. -bilgisayar-bilgisayar etkileşimi): pic.twitter.com/VLG7TJ1JQx

- Greg Brockman (@gdb) 13 Mayıs 2024

GPT-4o'nun herhangi bir metin, ses ve görüntü girişini aynı anda işleme yeteneği, OpenAI'nin çoklu göreve zorlandığında genellikle "çok fazla bilgi kaybeden" ChatGPT-4 gibi önceki yapay zeka araçlarıyla karşılaştırıldığında önemli bir ilerlemedir. .

İlgili: Apple, ChatGPT iPhone entegrasyonu için OpenAI ile anlaşmayı tamamlıyor: Rapor

OpenAI, "GPT-4o'nun mevcut modellerle karşılaştırıldığında özellikle görme ve ses anlama konusunda daha iyi olduğunu" söyledi; bu, kullanıcının duygularını ve nefes alma düzenlerini algılamayı da içeriyor.

Ayrıca OpenAI API'sinde GPT-4 Turbo'dan "çok daha hızlı" ve "%50 daha ucuz".

OpenAI, yeni AI aracının ses girişlerine ortalama 3,2 saniyelik bir süre ile 2,3 saniye kadar kısa bir sürede yanıt verebileceğini iddia ediyor ve bunun sıradan bir konuşmadaki insan tepki sürelerine benzer olduğunu söylüyor.

Dergi: ​​Yapay zeka kıyameti nasıl durdurulur: David Brin, Uplift yazarı