- OpenAI представила свою модель преобразования текста в вид

- OpenAI представила свою модель преобразования текста в видео Sora, генерирующую подробные видео из простых текстовых подсказок, продолжающую существующие видеоролики и создающую сцены на основе неподвижного изображения.
- Sora, основанная на «диффузионной» модели, как и ее предшественник DALL-E 3, может создавать сцены, подобные кинофильмам, с разрешением до 1080p с несколькими персонажами, определенными типами движения и точными деталями.
- Признано, что у Соры есть недостатки, такие как трудности с точным физическим моделированием, вызывающие проблемы с причинно-следственными связями и пространственными деталями.
- Модель в настоящее время доступна «красным командам» для оценки кибербезопасности, а также избранным дизайнерам, художникам и кинематографистам для сбора отзывов.
- Генеральный директор OpenAI Сэм Альтман открылся для запросов на создание собственных видео на X, поделившись семью видеороликами, созданными Sora, и получил положительные отзывы пользователей.
- Несмотря на похвалы, были высказаны опасения по поводу этических последствий, особенно после раскрытия инструментов искусственного интеллекта для создания изображений, обученных на незаконных материалах.
- Старший исследователь Nvidia Джим Фан описывает Sora как «физический движок, управляемый данными», а не как простой творческий инструмент, поскольку он детерминированно создает физику объектов на сцене.
#OpenAI  #OpenAI's #SORA  

Другие публикации автора

Последние новости

Другие публикации автора

Последние новости

Популярные статьи