4 października Meta zaprezentowała pakiet modeli sztucznej inteligencji o nazwie „Movie Gen”, który jest w stanie generować fotorealistyczne filmy o długości do 16 sekund, wraz z efektami dźwiękowymi i podkładami muzycznymi.

Movie Gen nie jest pierwszym multimodalnym modelem AI zdolnym do generowania wideo i dźwięku z prostych komunikatów tekstowych, ale wydaje się, że demonstruje najnowocześniejsze możliwości. Naukowcy odpowiedzialni za rozwój aplikacji twierdzą, że przewyższyła ona konkurencyjne systemy w testach na ludziach.

Nieruchomy obraz pobrany z filmu wygenerowanego przez Meta Movie Gen. Źródło: Meta

Generowanie filmów

Według wpisu na blogu Meta, Movie Gen jest obecnie w stanie wypuszczać filmy o długości do 16 sekund z szybkością klatek 16 klatek na sekundę (FPS). Aby to zobrazować, filmy hollywoodzkie przed erą cyfrową były tradycyjnie kręcone z szybkością 24 FPS, aby uzyskać to, co nazywa się „wyglądem filmowym”.

Choć wyższe wartości FPS są uważane za lepsze w grach i innych aplikacjach graficznych, 16 FPS w Meta nie odbiega znacząco od jakości obrazu uznawanej za profesjonalną.

Modele Movie Gen mogą generować zupełnie nowe filmy na podstawie prostych komunikatów tekstowych lub modyfikować istniejące obrazy lub filmy, aby zastąpić lub zmodyfikować obiekty i tła.

Zdjęcia z przesłanego filmu edytowane na trzy różne sposoby. Źródło: Meta

Jego najbardziej zaawansowanym wkładem może być jednak zdolność pakietu AI do generowania do 45 sekund dźwięku z efektami dźwiękowymi i muzyką w tle. Według Meta, Movie Gen integruje i synchronizuje dźwięk z ruchem w generowanych filmach.

Tylko badania

Meta na razie trzyma w tajemnicy modele bazowe Movie Gen. Firma nie podała harmonogramu wprowadzenia produktu na rynek i mówi, że przed wdrożeniem będzie wymagał dalszych testów bezpieczeństwa.

Zgodnie z artykułem badawczym zespołu ds. sztucznej inteligencji Meta:

„Modele bazowe Movie Gen zostały opracowane do celów badawczych i wymagają wielu udoskonaleń przed wdrożeniem… Kiedy wdrażamy te modele, uwzględniamy modele bezpieczeństwa, które mogą odrzucać monity wejściowe lub generacje naruszające nasze zasady, aby zapobiegać niewłaściwemu użyciu”.

Magazyn: Potentat w dziedzinie przeciwdziałania starzeniu się Bryan Johnson niemal poświęcił swoje życie kryptowalutom