За даними TechCrunch, генеральний директор OpenAI Сем Альтман розповів на Reddit AMA, що компанія зіткнулася зі значними обмеженнями обчислювальної потужності, які перешкоджають частоті випусків продуктів. Альтман пояснив, що головними факторами затримок є складність моделей і необхідність приймати жорсткі рішення щодо розподілу обчислювальних ресурсів. Звіти показують, що OpenAI намагається забезпечити достатню обчислювальну інфраструктуру для запуску та навчання своїх генеративних моделей. Нещодавно агентство Reuters повідомило, що OpenAI співпрацює з Broadcom для розробки чіпа AI, який, як очікується, буде доступний до 2026 року.

Через ці обмеження ємності розширений голосовий режим OpenAI для ChatGPT не матиме можливостей бачення, спочатку продемонстрованих у квітні. Під час квітневої прес-конференції OpenAI продемонстрував додаток ChatGPT, який реагує на візуальні підказки через камеру смартфона. Однак Fortune пізніше повідомила, що демо було поспішно, щоб відвернути увагу від конференції розробників Google I/O, і багато хто в OpenAI вважав, що GPT-4o не готовий до випуску. Як наслідок, лише голосова версія розширеного голосового режиму мала місяці затримок.

У AMA Альтман згадав, що немає встановленого графіку для наступного великого випуску генератора зображень OpenAI, DALL-E. Крім того, Sora, інструмент для генерації відео OpenAI, було відкладено через потребу вдосконалення моделі, міркувань безпеки та масштабування обчислень. Кевін Вейл, директор із продуктів OpenAI, зазначив, що Sora зіткнулася з технічними проблемами, що робить її менш конкурентоспроможною порівняно з конкуруючими системами Luma та Runway. Оригінальна система, представлена ​​в лютому, потребувала більше 10 хвилин для обробки 1-хвилинного відеокліпу. У жовтні Тім Брукс, один із співкерівників Sora, пішов у Google.

Альтман також обговорював можливість дозволу