- OpenAI 推出了其文本轉視頻模型 Sora，可以根據簡單的文本提示生成詳細的視頻、延續現有視頻以及基於靜態圖像創

- OpenAI 推出了其文本轉視頻模型 Sora，可以根據簡單的文本提示生成詳細的視頻、延續現有視頻以及基於靜態圖像創建場景。
- Sora 基於“擴散”模型（如其前身 DALL-E 3），可以創建分辨率高達 1080p 的電影般的場景，具有多個角色、特定的運動類型和準確的細節。
- 索拉被認爲有弱點，例如難以準確地進行物理模擬，導致因果關係和空間細節出現問題。
- 該模型目前可供“紅隊成員”進行網絡安全評估，並選擇設計師、視覺藝術家和電影製作人來收集反饋。
- OpenAI 首席執行官 Sam Altman 在 X 上接受了自定義視頻生成請求，分享了七個 Sora 生成的視頻，收到了用戶的積極反應。
- 儘管受到讚揚，但人們仍對道德影響表示擔憂，特別是在使用非法材料訓練的人工智能圖像生成工具被曝光之後。
- Nvidia 高級研究員 Jim Fan 將 Sora 描述爲“數據驅動的物理引擎”，而不是簡單的創意工具，因爲它確定性地創建場景中對象的物理特性。
#OpenAI #OpenAI's #SORA 

創作者的更多內容

實時新聞

創作者的更多內容

實時新聞

熱門文章