- OpenAI представила свою модель преобразования текста в видео Sora, генерирующую подробные видео из простых текстовых подсказок, продолжающую существующие видеоролики и создающую сцены на основе неподвижного изображения.

- Sora, основанная на «диффузионной» модели, как и ее предшественник DALL-E 3, может создавать сцены, подобные кинофильмам, с разрешением до 1080p с несколькими персонажами, определенными типами движения и точными деталями.

- Признано, что у Соры есть недостатки, такие как трудности с точным физическим моделированием, вызывающие проблемы с причинно-следственными связями и пространственными деталями.

- Модель в настоящее время доступна «красным командам» для оценки кибербезопасности, а также избранным дизайнерам, художникам и кинематографистам для сбора отзывов.

- Генеральный директор OpenAI Сэм Альтман открылся для запросов на создание собственных видео на X, поделившись семью видеороликами, созданными Sora, и получил положительные отзывы пользователей.

- Несмотря на похвалы, были высказаны опасения по поводу этических последствий, особенно после раскрытия инструментов искусственного интеллекта для создания изображений, обученных на незаконных материалах.

- Старший исследователь Nvidia Джим Фан описывает Sora как «физический движок, управляемый данными», а не как простой творческий инструмент, поскольку он детерминированно создает физику объектов на сцене.

#OpenAI #OpenAI's #SORA