- OpenAI đã tiết lộ mô hình chuyển văn bản thành video của mình, Sora, tạo ra các video chi tiết từ các lời nhắc văn bản đơn giản, tiếp tục các video hiện có và tạo cảnh dựa trên hình ảnh tĩnh.

- Sora dựa trên mô hình "khuếch tán" như người tiền nhiệm DALL-E 3, có thể tạo ra những cảnh giống như phim có độ phân giải lên tới 1080p với nhiều nhân vật, kiểu chuyển động cụ thể và chi tiết chính xác.

- Sora được thừa nhận là có những điểm yếu, chẳng hạn như gặp khó khăn với việc mô phỏng vật lý chính xác, gây ra các vấn đề về mối quan hệ nhân quả và chi tiết không gian.

- Mô hình này hiện đang được cung cấp cho các “đội đỏ” để đánh giá an ninh mạng và tuyển chọn các nhà thiết kế, nghệ sĩ thị giác, nhà làm phim để thu thập phản hồi.

- Giám đốc điều hành OpenAI Sam Altman đã tự mở ra các yêu cầu tạo video tùy chỉnh trên X, chia sẻ bảy video do Sora tạo, nhận được phản ứng tích cực từ người dùng.

- Bất chấp những lời khen ngợi, những lo ngại về ý nghĩa đạo đức, đặc biệt là sau khi tiết lộ các công cụ tạo hình ảnh AI được đào tạo về tài liệu bất hợp pháp, đã được nêu ra.

- Sora được nhà nghiên cứu cấp cao Jim Fan của Nvidia mô tả là một "công cụ vật lý dựa trên dữ liệu" chứ không phải là một công cụ sáng tạo đơn giản, vì nó tạo ra tính chất vật lý của các vật thể trong cảnh một cách xác định.

#OpenAI #OpenAI's #SORA