Meta představila 4. října sérii modelů umělé inteligence s názvem „Movie Gen“. Tyto modely mohou produkovat fotorealistické filmy v délce až 16 sekund a zahrnují také zvukové efekty a hudbu na pozadí.

Movie Gen není prvním multimodálním modelem umělé inteligence, který dokáže generovat video a zvuk z jednoduchých textových příkazů, ale předvádí špičkové schopnosti. Výzkumníci tvrdí, že aplikace překonává konkurenční systémy v testování na lidech.

Podle blogového příspěvku Meta může Movie Gen v současné době produkovat filmy při 16 FPS. To se docela blíží filmovému obrazu v profesionální kvalitě, vezmeme-li v úvahu, že hollywoodské filmy z předdigitální éry byly tradičně točeny rychlostí 24 FPS.

Modely Movie Gen mohou vytvářet zcela nové filmy nebo upravovat stávající obrázky a videa na základě jednoduchých textových příkazů. Jeho nejpokročilejším přínosem je schopnost produkovat až 45 sekund zvuku synchronizovaného s pohybem.

Meta zatím drží základní modely Movie Gen pod pokličkou a neuvedla časový rámec pro uvedení produktu na trh. Společnost poznamenává, že před nasazením bude vyžadováno další testování zabezpečení.

Co si o tomto vývoji myslíte? Podělte se s námi v komentářích.