- OpenAI 推出了其文本转视频模型 Sora,可以根据简单的文本提示生成详细的视频、延续现有视频以及基于静态图像创建场景。

- Sora 基于“扩散”模型(如其前身 DALL-E 3),可以创建分辨率高达 1080p 的电影般的场景,具有多个角色、特定的运动类型和准确的细节。

- 索拉被认为有弱点,例如难以准确地进行物理模拟,导致因果关系和空间细节出现问题。

- 该模型目前可供“红队成员”进行网络安全评估,并选择设计师、视觉艺术家和电影制作人来收集反馈。

- OpenAI 首席执行官 Sam Altman 在 X 上接受了自定义视频生成请求,分享了七个 Sora 生成的视频,收到了用户的积极反应。

- 尽管受到赞扬,但人们仍对道德影响表示担忧,特别是在使用非法材料训练的人工智能图像生成工具被曝光之后。

- Nvidia 高级研究员 Jim Fan 将 Sora 描述为“数据驱动的物理引擎”,而不是简单的创意工具,因为它确定性地创建场景中对象的物理特性。

#OpenAI #OpenAI's #SORA