10 月 4 日,Meta 推出了一套名为“Movie Gen”的人工智能模型,能够制作长达 16 秒的逼真的电影,并配有音效和背景音乐。

Movie Gen 并不是第一个能够根据简单的文本提示生成视频和音频的多模式 AI 模型,但它似乎展示了最先进的能力。负责该应用程序开发的研究人员声称,它在人体测试中的表现优于竞争对手的系统。

从 Meta Movie Gen 生成的电影中截取的静态图像。来源:Meta

電影創作

根据 Meta 的一篇博客文章,Movie Gen 目前能够以每秒 16 帧 (FPS) 的帧速率输出长达 16 秒的电影。从这个角度来看,数字时代之前的好莱坞电影传统上以 24 FPS 拍摄,以实现所谓的“电影效果”。

虽然在游戏和其他图形应用程序中,更高的 FPS 速率被认为更好,但 Meta 的 16 FPS 与专业品质的电影图像相差不远。

Movie Gen 模型可以根据简单的文本提示生成完全新颖的电影,或者修改现有的图像或视频以替换或修改对象和背景。

上传电影的静态图像经过三种不同的编辑。资料来源:Meta

然而,其最先进的贡献可能是 AI 套件能够生成长达 45 秒的音频,其中包含音效和背景音乐。据 Meta 称,Movie Gen 将音频与生成的视频中的动作进行集成和同步。

仅供研究

Meta 暂时对 Movie Gen 背后的基础模型保密。该公司尚未给出产品发布的时间表,并表示在部署之前需要进行进一步的安全测试。

根据 Meta 人工智能团队的一篇研究论文:

“Movie Gen 的基础模型是为了研究目的而开发的,在部署之前需要进行多次改进......当我们部署这些模型时,我们将加入可以拒绝违反我们政策的输入提示或生成的安全模型,以防止滥用。”

杂志:抗衰老大亨布莱恩·约翰逊几乎将自己的一生奉献给了加密货币