- OpenAI zaprezentowało swój model zamiany tekstu na wideo,

- OpenAI zaprezentowało swój model zamiany tekstu na wideo, Sora, generujący szczegółowe filmy na podstawie prostych podpowiedzi tekstowych, kontynuując istniejące filmy i tworząc sceny w oparciu o nieruchomy obraz.
- Sora, oparta na modelu „dyfuzyjnym”, podobnie jak jej poprzednik DALL-E 3, może tworzyć sceny przypominające film w rozdzielczości do 1080p z wieloma postaciami, określonymi typami ruchu i dokładnymi szczegółami.
- Uznaje się, że Sora ma słabe strony, takie jak problemy z dokładną symulacją fizyki, powodujące problemy ze związkami przyczynowo-skutkowymi i szczegółami przestrzennymi.
— Model jest obecnie dostępny dla „czerwonych zespołów” w celu oceny cyberbezpieczeństwa oraz wybranych projektantów, artystów wizualnych i filmowców w celu zebrania opinii.
- Dyrektor generalny OpenAI, Sam Altman, otworzył się na prośby o niestandardowe generowanie wideo w X, udostępniając siedem filmów wygenerowanych przez Sorę, spotykając się z pozytywnymi reakcjami użytkowników.
- Pomimo pochwał pojawiły się obawy dotyczące implikacji etycznych, zwłaszcza po ujawnieniu narzędzi do generowania obrazów AI wytrenowanych na nielegalnych materiałach.
- Sora została opisana przez Jima Fana, starszego badacza Nvidii, jako „silnik fizyki oparty na danych”, a nie proste narzędzie kreatywne, ponieważ w sposób deterministyczny tworzy fizykę obiektów w scenie.
#OpenAI  #OpenAI's #SORA  
Odkryj więcej od twórcy

Najnowsze wiadomości