據 Cointelegraph 報道,Meta 於 10 月 4 日推出了一套名爲 Movie Gen 的人工智能模型,能夠生成最長 16 秒的逼真電影,並配有音效和背景音樂。

Movie Gen 並非首個能從簡單文本提示生成視頻和音頻的多模態 AI 模型,但其表現優於競爭對手系統。Meta 表示,該模型在人工測試中表現出色。

Movie Gen 目前能以 16 FPS 的幀率輸出最長 16 秒的電影。儘管好萊塢電影傳統上以 24 FPS 拍攝,但 Meta 的 16 FPS 也接近專業電影質量。

該模型可根據簡單文本提示生成全新電影,或修改現有圖像和視頻,替換或修改對象和背景。

Movie Gen 的一大亮點是其生成最長 45 秒音頻的能力,包括音效和背景音樂,並與生成視頻中的動作同步。

Meta 表示,Movie Gen 的基礎模型目前僅用於研究,尚未公佈產品發佈的時間表,並需進一步安全測試。