Potrivit Cointelegraph, Meta a introdus pe 4 octombrie o nouă suită de modele de inteligență artificială numită „Movie Gen”, capabilă să genereze filme fotorealiste de până la 16 secunde, cu efecte sonore și piese muzicale de suport. Deși nu este primul model AI multimodal care generează video și audio din mesaje text, Movie Gen pare să demonstreze capabilități de ultimă generație. Cercetătorii susțin că a depășit sistemele rivale în testele umane.

Postarea pe blog a lui Meta dezvăluie că Movie Gen poate scoate filme la o rată de cadre de 16 cadre pe secundă (FPS). Pentru context, filmele tradiționale de la Hollywood au fost filmate la 24 FPS pentru a obține „aspectul filmului”. Deși ratele FPS mai mari sunt preferate în jocuri și alte aplicații grafice, 16 FPS de la Meta este aproape de imaginile de film de calitate profesională. Modelele pot genera filme complet noi pe baza unor simple solicitări de text sau pot modifica imagini sau videoclipuri existente pentru a înlocui sau modifica obiecte și fundaluri.

Una dintre cele mai avansate caracteristici ale Movie Gen este capacitatea sa de a genera până la 45 de secunde de sunet, inclusiv efecte sonore și muzică de fundal, care este integrată și sincronizată cu mișcarea din videoclipurile generate. În ciuda acestor progrese, Meta păstrează sub secret modelele de bază din spatele Movie Gen pentru moment. Compania nu a furnizat un interval de timp pentru lansarea produsului, afirmând că sunt necesare teste suplimentare de siguranță înainte de implementare.

O lucrare de cercetare a echipei Meta AI indică faptul că modelele Movie Gen au fost dezvoltate în scopuri de cercetare și au nevoie de mai multe îmbunătățiri înainte de a fi implementate. Compania intenționează să încorporeze modele de siguranță pentru a respinge solicitările de intrare sau generațiile care încalcă politicile lor pentru a preveni utilizarea abuzivă.