据 Cointelegraph 报道,Meta 于 10 月 4 日推出了一套名为 Movie Gen 的人工智能模型,能够生成最长 16 秒的逼真电影,并配有音效和背景音乐。

Movie Gen 并非首个能从简单文本提示生成视频和音频的多模态 AI 模型,但其表现优于竞争对手系统。Meta 表示,该模型在人工测试中表现出色。

Movie Gen 目前能以 16 FPS 的帧率输出最长 16 秒的电影。尽管好莱坞电影传统上以 24 FPS 拍摄,但 Meta 的 16 FPS 也接近专业电影质量。

该模型可根据简单文本提示生成全新电影,或修改现有图像和视频,替换或修改对象和背景。

Movie Gen 的一大亮点是其生成最长 45 秒音频的能力,包括音效和背景音乐,并与生成视频中的动作同步。

Meta 表示,Movie Gen 的基础模型目前仅用于研究,尚未公布产品发布的时间表,并需进一步安全测试。