- OpenAI 推出了其文本转视频模型 Sora，可以根据简单的文本提示生成详细的视频、延续现有视频以及基于静态图像创

- OpenAI 推出了其文本转视频模型 Sora，可以根据简单的文本提示生成详细的视频、延续现有视频以及基于静态图像创建场景。
- Sora 基于“扩散”模型（如其前身 DALL-E 3），可以创建分辨率高达 1080p 的电影般的场景，具有多个角色、特定的运动类型和准确的细节。
- 索拉被认为有弱点，例如难以准确地进行物理模拟，导致因果关系和空间细节出现问题。
- 该模型目前可供“红队成员”进行网络安全评估，并选择设计师、视觉艺术家和电影制作人来收集反馈。
- OpenAI 首席执行官 Sam Altman 在 X 上接受了自定义视频生成请求，分享了七个 Sora 生成的视频，收到了用户的积极反应。
- 尽管受到赞扬，但人们仍对道德影响表示担忧，特别是在使用非法材料训练的人工智能图像生成工具被曝光之后。
- Nvidia 高级研究员 Jim Fan 将 Sora 描述为“数据驱动的物理引擎”，而不是简单的创意工具，因为它确定性地创建场景中对象的物理特性。
#OpenAI  #OpenAI's #SORA  

创作者的更多内容

实时新闻

创作者的更多内容

实时新闻

热门文章