Meta stellte am 4. Oktober eine Reihe von künstlichen Intelligenzmodellen namens „Movie Gen“ vor, die in der Lage sind, fotorealistische Filme mit einer Länge von bis zu 16 Sekunden zu erstellen, komplett mit Soundeffekten und musikalischer Untermalung.

Movie Gen ist nicht das erste multimodale KI-Modell, das aus einfachen Textaufforderungen Video und Audio generieren kann, aber es scheint über hochmoderne Fähigkeiten zu verfügen. Die für die Entwicklung der Anwendung verantwortlichen Forscher behaupten, dass es bei Tests mit Menschen konkurrierende Systeme übertroffen hat.

Ein Standbild aus einem von Meta Movie Gen generierten Film. Quelle: Meta

Film Gen

Laut einem Blogbeitrag von Meta kann Movie Gen derzeit bis zu 16 Sekunden lange Filme mit einer Bildrate von 16 Bildern pro Sekunde (FPS) ausgeben. Zum Vergleich: Hollywood-Filme vor dem digitalen Zeitalter wurden traditionell mit 24 FPS gedreht, um den sogenannten „Filmlook“ zu erzielen.

Während höhere FPS-Raten bei Spielen und anderen Grafikanwendungen als besser gelten, sind die 16 FPS von Meta nicht weit von dem entfernt, was als professionelle Filmbildqualität gelten würde.

Die Movie Gen-Modelle können auf der Grundlage einfacher Textaufforderungen völlig neuartige Filme generieren oder vorhandene Bilder oder Videos ändern, um Objekte und Hintergründe zu ersetzen oder zu verändern.

Standbilder aus einem hochgeladenen Film, auf drei verschiedene Arten bearbeitet. Quelle: Meta

Der fortschrittlichste Beitrag dürfte jedoch die Fähigkeit der KI-Suite sein, bis zu 45 Sekunden Audio mit Soundeffekten und Hintergrundmusik zu generieren. Laut Meta integriert und synchronisiert Movie Gen das Audio mit der Bewegung in den generierten Videos.

Nur Forschung 

Meta hält die Basismodelle hinter Movie Gen vorerst geheim. Das Unternehmen hat noch keinen Zeitplan für die Produkteinführung genannt und erklärt, dass vor der Einführung weitere Sicherheitstests erforderlich sein werden.

Laut einer Forschungsarbeit des KI-Teams von Meta:

„Die Movie Gen-Grundmodelle wurden zu Forschungszwecken entwickelt und müssen vor ihrer Bereitstellung mehrfach verbessert werden … Wenn wir diese Modelle bereitstellen, werden wir Sicherheitsmodelle integrieren, die Eingabeaufforderungen oder Generierungen ablehnen können, die gegen unsere Richtlinien verstoßen, um Missbrauch zu verhindern.“

Magazin: Anti-Aging-Tycoon Bryan Johnson hätte sein Leben fast der Kryptowährung gewidmet