Laut Cointelegraph hat Meta am 4. Oktober eine Reihe künstlicher Intelligenzmodelle namens Movie Gen auf den Markt gebracht, die realistische Filme von bis zu 16 Sekunden Länge, komplett mit Soundeffekten und Hintergrundmusik, erzeugen können.

Movie Gen ist nicht das erste multimodale KI-Modell, das Video und Audio aus einfachen Textaufforderungen generiert, aber es übertrifft konkurrierende Systeme. Meta sagte, das Modell habe in Tests am Menschen gut abgeschnitten.

Movie Gen kann derzeit Filme mit einer Länge von bis zu 16 Sekunden und 16 FPS ausgeben. Während Hollywood-Filme traditionell mit 24 FPS gedreht werden, kommen Metas 16 FPS auch nahe an professioneller Filmqualität heran.

Das Modell kann auf der Grundlage einfacher Texteingaben völlig neue Filme generieren oder vorhandene Bilder und Videos modifizieren und Objekte und Hintergründe ersetzen oder modifizieren.

Eines der Highlights von Movie Gen ist die Fähigkeit, bis zu 45 Sekunden Audio, einschließlich Soundeffekten und Hintergrundmusik, synchron mit der Aktion im resultierenden Video zu erzeugen.

Meta sagte, dass das Basismodell von Movie Gen derzeit nur für Forschungszwecke verwendet wird und ein Zeitplan für die Produktveröffentlichung noch nicht bekannt gegeben wurde und weitere Sicherheitstests erforderlich sind.