Meta a présenté une série de modèles d'IA appelée « Movie Gen » le 4 octobre. Ces modèles peuvent produire des films photoréalistes d'une durée maximale de 16 secondes et inclure également des effets sonores et une musique de fond.

Movie Gen n'est pas le premier modèle d'IA multimodal capable de générer de la vidéo et de l'audio à partir de simples commandes de texte, mais il présente des capacités de pointe. Les chercheurs affirment que l’application surpasse les systèmes concurrents lors des tests sur les humains.

Selon le blog de Meta, Movie Gen peut actuellement produire des films à 16 FPS. C'est assez proche d'une image cinématographique de qualité professionnelle, étant donné que les films hollywoodiens de l'ère pré-numérique étaient traditionnellement tournés à 24 FPS.

Les modèles Movie Gen peuvent produire des films entièrement nouveaux ou modifier des images et des vidéos existantes sur la base de simples commandes textuelles. Son apport le plus avancé est la capacité de produire jusqu'à 45 secondes de son synchronisé avec le mouvement.

Meta garde secrets les modèles de base de Movie Gen pour le moment et n'a pas donné de délai pour le lancement du produit. La société note que des tests de sécurité supplémentaires seront nécessaires avant le déploiement.

Que pensez-vous de cette évolution ? Partagez avec nous dans les commentaires.