Menurut Cointelegraph, Meta telah memperkenalkan rangkaian model kecerdasan buatan baru bernama 'Movie Gen' pada tanggal 4 Oktober, yang mampu menghasilkan film fotorealistik hingga 16 detik, lengkap dengan efek suara dan musik latar. Meskipun bukan model AI multimoda pertama yang menghasilkan video dan audio dari perintah teks, Movie Gen tampaknya menunjukkan kemampuan canggih. Para peneliti mengklaim bahwa model ini mengungguli sistem pesaing dalam pengujian manusia.

Posting blog Meta mengungkap bahwa Movie Gen dapat menghasilkan film pada frame rate 16 frame per detik (FPS). Sebagai konteks, film-film Hollywood tradisional direkam pada 24 FPS untuk mencapai 'tampilan film.' Meskipun FPS yang lebih tinggi lebih disukai dalam permainan dan aplikasi grafis lainnya, 16 FPS Meta mendekati citra film berkualitas profesional. Model-model tersebut dapat menghasilkan film yang sama sekali baru berdasarkan perintah teks sederhana atau memodifikasi gambar atau video yang ada untuk mengganti atau mengubah objek dan latar belakang.

Salah satu fitur Movie Gen yang paling canggih adalah kemampuannya untuk menghasilkan audio hingga 45 detik, termasuk efek suara dan musik latar, yang terintegrasi dan disinkronkan dengan gerakan dalam video yang dihasilkan. Meskipun ada kemajuan ini, Meta masih merahasiakan model dasar di balik Movie Gen untuk saat ini. Perusahaan belum memberikan kerangka waktu untuk peluncuran produk tersebut, dengan menyatakan bahwa pengujian keamanan lebih lanjut diperlukan sebelum penerapan.

Sebuah makalah penelitian dari tim AI Meta menunjukkan bahwa model Movie Gen dikembangkan untuk tujuan penelitian dan memerlukan beberapa perbaikan sebelum diterapkan. Perusahaan berencana untuk menggabungkan model keamanan untuk menolak permintaan masukan atau pembuatan yang melanggar kebijakan mereka guna mencegah penyalahgunaan.