Meta 推出可制作带有声音的逼真电影的 AI 模型

10 月 4 日，Meta 推出了一套名为“Movie Gen”的人工智能模型，能够制作长达 16 秒的逼真的电影，并配有音效和背景音乐。
Movie Gen 并不是第一个能够根据简单的文本提示生成视频和音频的多模式 AI 模型，但它似乎展示了最先进的能力。负责该应用程序开发的研究人员声称，它在人体测试中的表现优于竞争对手的系统。
从 Meta Movie Gen 生成的电影中截取的静态图像。来源：Meta
電影創作
根据 Meta 的一篇博客文章，Movie Gen 目前能够以每秒 16 帧 (FPS) 的帧速率输出长达 16 秒的电影。从这个角度来看，数字时代之前的好莱坞电影传统上以 24 FPS 拍摄，以实现所谓的“电影效果”。
虽然在游戏和其他图形应用程序中，更高的 FPS 速率被认为更好，但 Meta 的 16 FPS 与专业品质的电影图像相差不远。
Movie Gen 模型可以根据简单的文本提示生成完全新颖的电影，或者修改现有的图像或视频以替换或修改对象和背景。
上传电影的静态图像经过三种不同的编辑。资料来源：Meta
然而，其最先进的贡献可能是 AI 套件能够生成长达 45 秒的音频，其中包含音效和背景音乐。据 Meta 称，Movie Gen 将音频与生成的视频中的动作进行集成和同步。
仅供研究
Meta 暂时对 Movie Gen 背后的基础模型保密。该公司尚未给出产品发布的时间表，并表示在部署之前需要进行进一步的安全测试。
根据 Meta 人工智能团队的一篇研究论文：
“Movie Gen 的基础模型是为了研究目的而开发的，在部署之前需要进行多次改进......当我们部署这些模型时，我们将加入可以拒绝违反我们政策的输入提示或生成的安全模型，以防止滥用。”
杂志：抗衰老大亨布莱恩·约翰逊几乎将自己的一生奉献给了加密货币

Meta 推出可制作带有声音的逼真电影的 AI 模型

创作者的更多内容

实时新闻

Meta 推出可制作带有声音的逼真电影的 AI 模型

创作者的更多内容

实时新闻

热门文章