Według TechCrunch, dyrektor generalny OpenAI Sam Altman ujawnił w AMA na Reddicie, że firma boryka się z poważnymi ograniczeniami pojemności obliczeniowej, które utrudniają częstotliwość wydawania produktów. Altman wyjaśnił, że złożoność modeli oraz potrzeba podejmowania trudnych decyzji w zakresie alokacji obliczeń są głównymi czynnikami opóźnień. Doniesienia wskazują, że OpenAI miało trudności z zabezpieczeniem wystarczającej infrastruktury obliczeniowej do uruchamiania i szkolenia swoich modeli generatywnych. Niedawno Reuters doniósł, że OpenAI współpracowało z Broadcom w celu opracowania chipu AI, który ma być dostępny do 2026 roku.
Z powodu tych ograniczeń pojemnościowych, zaawansowany tryb głosowy OpenAI dla ChatGPT nie otrzyma możliwości wizualnych, które pierwotnie zademonstrowano w kwietniu. Podczas kwietniowego wydarzenia prasowego OpenAI zaprezentowało aplikację ChatGPT reagującą na wizualne wskazówki za pomocą kamery smartfona. Jednak Fortune później doniosło, że demo zostało przyspieszone, aby odwrócić uwagę od konferencji deweloperskiej Google I/O, a wielu w OpenAI uważało, że GPT-4o nie jest gotowy do wydania. W konsekwencji, wersja tylko głosowa zaawansowanego trybu głosowego doświadczyła miesięcy opóźnień.
W AMA Altman wspomniał, że nie ma ustalonego harmonogramu dla następnej dużej wersji generatora obrazów OpenAI, DALL-E. Dodatkowo, Sora, narzędzie do generowania wideo OpenAI, zostało opóźnione z powodu potrzeby doskonalenia modelu, rozważenia kwestii bezpieczeństwa oraz skalowania obliczeń. Kevin Weil, dyrektor ds. produktów OpenAI, zauważył, że Sora napotkała wyzwania techniczne, co sprawia, że jest mniej konkurencyjna w porównaniu do systemów rywalizujących z Luma i Runway. Oryginalny system, zaprezentowany w lutym, wymagał ponad 10 minut na przetworzenie 1-minutowego klipu wideo. W październiku Tim Brooks, jeden z współliderów Sory, odszedł do Google.
Altman również omówił możliwość pozwolenia na