#TrendingTopic

Open ai Sora Vs DALL-E 3

Sora và DALL-E 3 đều là những mô hình AI tổng quát có thể tạo hình ảnh hoặc video từ lời nhắc bằng văn bản. Tuy nhiên, họ có một số khác biệt về khả năng và hạn chế của mình. Dưới đây là một số khác biệt chính:

Sora có thể tạo video có thời lượng tối đa 60 giây, trong khi DALL-E 3 chỉ có thể tạo hình ảnh có kích thước tối đa 512x512 pixel

Sora có thể tạo video có nhiều nhân vật, chuyển động camera phức tạp và cảm xúc sống động, trong khi DALL-E 3 chỉ có thể tạo hình ảnh với các vật thể và cảnh tĩnh

Sora sử dụng mô hình khuếch tán, hoạt động bằng cách tạo ra một hình ảnh nhiễu và sau đó làm cho nó rõ ràng hơn từng bước. DALL-E 3 sử dụng mô hình biến áp, hoạt động bằng cách dự đoán từng pixel của hình ảnh

Sora có thể tạo video với các tỷ lệ khung hình và độ phân giải khác nhau, trong khi DALL-E 3 chỉ có thể tạo hình ảnh có kích thước và hình dạng cố định

Sora có thể tiếp tục các video hiện có hoặc tạo cảnh dựa trên hình ảnh tĩnh, trong khi DALL-E 3 chỉ có thể tạo hình ảnh dựa trên lời nhắc bằng văn bản

Sora đôi khi có thể mắc lỗi khi mô phỏng tính chất vật lý của một cảnh, chẳng hạn như không hiển thị tác động của các hành động hoặc trộn lẫn các hướng. DALL-E 3 đôi khi có thể mắc lỗi khi hiểu lời nhắc văn bản, chẳng hạn như không hiển thị chính xác số lượng hoặc vị trí của đối tượng