Menurut TechCrunch, CEO OpenAI Sam Altman mengungkapkan dalam AMA Reddit bahwa perusahaan menghadapi batasan kapasitas komputasi yang signifikan, yang menghambat frekuensi rilis produk. Altman menjelaskan bahwa kompleksitas model dan kebutuhan untuk membuat keputusan sulit tentang alokasi komputasi adalah faktor utama dalam penundaan. Laporan menunjukkan bahwa OpenAI telah berjuang untuk mendapatkan infrastruktur komputasi yang cukup untuk menjalankan dan melatih model generatifnya. Baru-baru ini, Reuters melaporkan bahwa OpenAI telah bekerja sama dengan Broadcom untuk mengembangkan chip AI, yang diharapkan tersedia pada tahun 2026.
Karena batasan kapasitas ini, Mode Suara Lanjutan OpenAI untuk ChatGPT tidak akan menerima kemampuan penglihatan yang awalnya ditunjukkan pada bulan April. Selama acara pers bulan April, OpenAI memamerkan aplikasi ChatGPT yang merespons isyarat visual melalui kamera smartphone. Namun, Fortune kemudian melaporkan bahwa demo tersebut dilakukan tergesa-gesa untuk mengalihkan perhatian dari konferensi pengembang I/O Google, dan banyak di dalam OpenAI percaya bahwa GPT-4o belum siap untuk dirilis. Akibatnya, versi hanya suara dari Mode Suara Lanjutan mengalami penundaan selama berbulan-bulan.
Dalam AMA, Altman menyebutkan bahwa tidak ada jadwal yang ditetapkan untuk rilis besar berikutnya dari generator gambar OpenAI, DALL-E. Selain itu, Sora, alat pembuat video OpenAI, telah tertunda karena kebutuhan untuk menyempurnakan model, pertimbangan keselamatan, dan penyesuaian komputasi. Kevin Weil, kepala produk OpenAI, mencatat bahwa Sora menghadapi tantangan teknis, menjadikannya kurang kompetitif dibandingkan dengan sistem saingan dari Luma dan Runway. Sistem asli, yang diluncurkan pada bulan Februari, membutuhkan waktu lebih dari 10 menit untuk memproses klip video berdurasi 1 menit. Pada bulan Oktober, Tim Brooks, salah satu pemimpin Sora, pindah ke Google.
Altman juga membahas kemungkinan untuk memungkinkan