Kuaishou Technology Unveils Kling AI, Empowering Users To Create Videos Via Text-to-Video Generation

Công ty công nghệ Trung Quốc Kuaishou Technology, nổi tiếng với cộng đồng nội dung và nền tảng xã hội, đã tiết lộ Kling AI, một công cụ mới được thiết kế để tạo ra các video có độ chân thực cao từ lời nhắc văn bản, đại diện cho một đối thủ cạnh tranh tiềm năng với mô hình Sora của OpenAI.

Sora là một mô hình AI được thiết kế để tạo ra những cảnh sáng tạo và sống động như thật dựa trên dữ liệu nhập văn bản. Trọng tâm của khả năng tạo video của Sora là nền tảng học sâu. Mô hình này tìm hiểu mối liên hệ giữa các từ và cụm từ với nhiều yếu tố khác nhau như đồ vật, hành động, môi trường và sắc thái văn phong.

Trong khi mô hình Sora của OpenAI có khả năng tạo video có thời lượng lên tới một phút thì Kling AI có thể tạo ra các video chân thực dài tới hai phút với độ phân giải 1080p ở 30 khung hình mỗi giây. Nó hỗ trợ nhiều tỷ lệ khung hình và đạt được mức độ chi tiết cao thông qua các kỹ thuật tái tạo khuôn mặt và cơ thể 3D tiên tiến, đảm bảo rằng các video do AI tạo ra hầu như không thể phân biệt được với các cảnh quay thực.

Kling AI sử dụng Bộ mã hóa tự động biến đổi 3D (VAE) để tái tạo khuôn mặt và cơ thể, cho phép tạo ra các biểu cảm chi tiết và chuyển động chân tay từ một hình ảnh toàn thân. Công nghệ này được tăng cường nhờ cơ chế chú ý khớp không gian thời gian 3D, nâng cao khả năng xử lý các cảnh và chuyển động phức tạp của mô hình. Điều này đảm bảo rằng nội dung được tạo ra duy trì tính nhất quán với các định luật vật lý.

Ứng dụng áp dụng cách tiếp cận truy cập mở, mặc dù có những hạn chế về khu vực. Mô hình hiện đang hoạt động trong giai đoạn thử nghiệm.

Chưa đầy 48 giờ trước, đối thủ Kling của Sora đã tụt hạng.

Mọi người đã có quyền truy cập và tạo các video AI hoang dã. 🤯

1. Quảng cáo bia MadMax được thực hiện trong 1 giờ pic.twitter.com/CyKm2aI0It

– Min Choi (@minchoi) Ngày 8 tháng 6 năm 2024

Công nghệ Kuaishou ra mắt mô hình chuyển văn bản thành hình ảnh KwaiYii LLM và Kolors

Kuaishou Technology là một trong số các công ty công nghệ Trung Quốc đang cạnh tranh để giới thiệu các lựa chọn thay thế cho Sora. Khả năng chuyển văn bản thành video thể hiện sự đổi mới AI gần đây nhất của họ, sau khi giới thiệu mô hình ngôn ngữ lớn KwaiYii (LLM) và mô hình chuyển văn bản thành hình ảnh Kolors, ra mắt vào tháng 5.

Ngoài ra, tính năng “AI Dancer”, có thể truy cập được trong ứng dụng Công nghệ Kuaishou và ứng dụng sản xuất video Kwaiying, cho phép người dùng tải lên ảnh tĩnh và tạo video có nhân vật nhảy theo nhịp điệu và chuyển động cụ thể.

Bài đăng Công nghệ Kuaishou tiết lộ AI Kling, trao quyền cho người dùng tạo video thông qua việc tạo văn bản thành video xuất hiện đầu tiên trên Metaverse Post.