Podle TechCrunch odhalil generální ředitel OpenAI Sam Altman v AMA na Redditu, že společnost čelí významným omezením výpočetní kapacity, což brání frekvenci vydání produktů. Altman vysvětlil, že složitost modelů a potřeba přijímat obtížná rozhodnutí ohledně přidělování výpočetní kapacity jsou hlavními faktory zpoždění. Zprávy uvádějí, že OpenAI má potíže zajistit dostatečnou výpočetní infrastrukturu pro provoz a trénink svých generativních modelů. Nedávno Reuters informoval, že OpenAI spolupracuje s Broadcomem na vývoji AI čipu, který by měl být k dispozici do roku 2026.

Vzhledem k těmto kapacitním omezením nebude pokročilý hlasový režim OpenAI pro ChatGPT získávat vizuální schopnosti, které byly původně předvedeny v dubnu. Během dubnové tiskové akce OpenAI ukázala aplikaci ChatGPT reagující na vizuální podněty prostřednictvím fotoaparátu chytrého telefonu. Nicméně, Fortune později informoval, že demo bylo uspěcháno, aby se odvrátila pozornost od vývojářské konference Googlu I/O, a mnozí uvnitř OpenAI se domnívali, že GPT-4o není připraveno na vydání. V důsledku toho zažila hlasová verze pokročilého hlasového režimu měsíce zpoždění.

Na AMA Altman zmínil, že není stanoven žádný časový rámec pro další hlavní vydání generátoru obrázků OpenAI, DALL-E. Kromě toho bylo zpožděno Sora, nástroj OpenAI pro generování videí, kvůli potřebě dokonalosti modelů, bezpečnostním úvahám a škálování výpočetní kapacity. Kevin Weil, hlavní produktový ředitel OpenAI, poznamenal, že Sora čelila technickým výzvám, což ji činilo méně konkurenceschopnou ve srovnání s rivaly z Luma a Runway. Původní systém, představený v únoru, potřeboval více než 10 minut k zpracování 1minutového videoklipu. V říjnu odešel Tim Brooks, jeden z vedoucích Sory, do Googlu.

Altman také diskutoval o možnosti umožnit