- OpenAI zaprezentowało swój model zamiany tekstu na wideo, Sora, generujący szczegółowe filmy na podstawie prostych podpowiedzi tekstowych, kontynuując istniejące filmy i tworząc sceny w oparciu o nieruchomy obraz.

- Sora, oparta na modelu „dyfuzyjnym”, podobnie jak jej poprzednik DALL-E 3, może tworzyć sceny przypominające film w rozdzielczości do 1080p z wieloma postaciami, określonymi typami ruchu i dokładnymi szczegółami.

- Uznaje się, że Sora ma słabe strony, takie jak problemy z dokładną symulacją fizyki, powodujące problemy ze związkami przyczynowo-skutkowymi i szczegółami przestrzennymi.

— Model jest obecnie dostępny dla „czerwonych zespołów” w celu oceny cyberbezpieczeństwa oraz wybranych projektantów, artystów wizualnych i filmowców w celu zebrania opinii.

- Dyrektor generalny OpenAI, Sam Altman, otworzył się na prośby o niestandardowe generowanie wideo w X, udostępniając siedem filmów wygenerowanych przez Sorę, spotykając się z pozytywnymi reakcjami użytkowników.

- Pomimo pochwał pojawiły się obawy dotyczące implikacji etycznych, zwłaszcza po ujawnieniu narzędzi do generowania obrazów AI wytrenowanych na nielegalnych materiałach.

- Sora została opisana przez Jima Fana, starszego badacza Nvidii, jako „silnik fizyki oparty na danych”, a nie proste narzędzie kreatywne, ponieważ w sposób deterministyczny tworzy fizykę obiektów w scenie.

#OpenAI #OpenAI's #SORA