根據TechCrunch的報導,OpenAI首席執行官Sam Altman在Reddit AMA中透露,公司面臨著重大計算能力限制,這妨礙了產品發布的頻率。Altman解釋說,模型的複雜性以及在計算資源分配上做出艱難決策的必要性是導致延遲的主要因素。報導指出OpenAI一直在努力確保足夠的計算基礎設施來運行和訓練其生成模型。最近,Reuters報導OpenAI一直在與Broadcom合作開發一種預計將在2026年可用的AI芯片。

由於這些容量限制,OpenAI的ChatGPT進階語音模式將不會獲得最初在四月展示的視覺能力。在四月的新聞發布活動中,OpenAI展示了ChatGPT應用程式通過智能手機相機對視覺提示的反應。然而,Fortune後來報導說,該演示是匆忙進行的,以轉移對Google I/O開發者大會的注意,並且OpenAI內部的許多人認為GPT-4o尚未準備好發布。因此,僅語音的進階語音模式經歷了數月的延遲。

在AMA中,Altman提到OpenAI的圖像生成器DALL-E下一個重大版本的發布沒有固定的時間表。此外,OpenAI的視頻生成工具Sora因為模型完善、安全考量和計算擴展的需要而被延遲。OpenAI的首席產品官Kevin Weil指出,Sora面臨技術挑戰,使其與來自Luma和Runway的競爭系統相比競爭力下降。原始系統在二月份首次亮相,處理一段1分鐘視頻片段需要超過10分鐘的時間。在十月,Sora的共同負責人Tim Brooks離開了Google。

Altman還討論了允許的可能性