- OpenAI 推出了其文本轉視頻模型 Sora,可以根據簡單的文本提示生成詳細的視頻、延續現有視頻以及基於靜態圖像創建場景。

- Sora 基於“擴散”模型(如其前身 DALL-E 3),可以創建分辨率高達 1080p 的電影般的場景,具有多個角色、特定的運動類型和準確的細節。

- 索拉被認爲有弱點,例如難以準確地進行物理模擬,導致因果關係和空間細節出現問題。

- 該模型目前可供“紅隊成員”進行網絡安全評估,並選擇設計師、視覺藝術家和電影製作人來收集反饋。

- OpenAI 首席執行官 Sam Altman 在 X 上接受了自定義視頻生成請求,分享了七個 Sora 生成的視頻,收到了用戶的積極反應。

- 儘管受到讚揚,但人們仍對道德影響表示擔憂,特別是在使用非法材料訓練的人工智能圖像生成工具被曝光之後。

- Nvidia 高級研究員 Jim Fan 將 Sora 描述爲“數據驅動的物理引擎”,而不是簡單的創意工具,因爲它確定性地創建場景中對象的物理特性。

#OpenAI #OpenAI's #SORA