Kuaishou Technology Unveils Kling AI, Empowering Users To Create Videos Via Text-to-Video Generation

Perusahaan teknologi Tiongkok, Kuaishou Technology, yang terkenal dengan komunitas konten dan platform sosialnya, meluncurkan Kling AI, alat baru yang dirancang untuk menghasilkan video yang sangat realistis dari perintah teks, yang mewakili pesaing potensial model Sora OpenAI.

Sora adalah model AI yang dirancang untuk menghasilkan adegan yang nyata dan kreatif berdasarkan masukan tekstual. Inti dari kemampuan pembuatan video Sora adalah kerangka pembelajaran yang mendalam. Model mempelajari asosiasi antara kata dan frasa dengan berbagai elemen seperti objek, tindakan, lingkungan, dan nuansa gaya.

Meskipun model Sora OpenAI mampu menghasilkan video berdurasi hingga satu menit, Kling AI dapat menghasilkan video realistis hingga dua menit dengan resolusi 1080p pada 30 frame per detik. Ini mendukung berbagai rasio aspek dan mencapai tingkat detail yang tinggi melalui teknik rekonstruksi wajah dan tubuh 3D yang canggih, memastikan bahwa video yang dihasilkan AI hampir tidak dapat dibedakan dari rekaman sebenarnya.

Kling AI menggunakan 3D Variational Autoencoder (VAE) untuk merekonstruksi wajah dan tubuh, memungkinkan pembuatan ekspresi detail dan gerakan anggota tubuh dari satu gambar seluruh tubuh. Teknologi ini ditingkatkan dengan mekanisme perhatian bersama spatiotemporal 3D, yang meningkatkan kemampuan model untuk menangani pemandangan dan gerakan yang kompleks. Hal ini memastikan bahwa konten yang dihasilkan tetap konsisten dengan hukum fisika.

Aplikasi ini mengadopsi pendekatan akses terbuka, meskipun dengan batasan regional. Model tersebut saat ini sedang berfungsi dalam tahap uji coba.

Kurang dari 48 jam yang lalu, pesaing Sora, Kling, terjatuh.

Orang-orang sudah mendapatkan akses dan membuat video AI yang liar. 🤯

1. Iklan MadMax Beer dibuat dalam 1 jampic.twitter.com/CyKm2aI0It

— Min Choi (@minchoi) 8 Juni 2024

Teknologi Kuaishou Meluncurkan Model Teks-ke-Gambar KwaiYii LLM dan Kolors

Kuaishou Technology adalah salah satu dari beberapa perusahaan teknologi Tiongkok yang bersaing untuk memperkenalkan alternatif selain Sora. Kemampuan teks-ke-video mewakili inovasi AI terbarunya, setelah diperkenalkannya model bahasa besar (LLM) KwaiYii dan model teks-ke-gambar Kolors, yang memulai debutnya pada bulan Mei.

Selain itu, fitur “AI Dancer”, yang dapat diakses dalam aplikasi Teknologi Kuaishou dan aplikasi produksi video Kwaiying, memungkinkan pengguna mengunggah foto statis dan menghasilkan video yang menampilkan karakter menari dengan ritme dan gerakan tertentu.

Pos Teknologi Kuaishou Meluncurkan Kling AI, Memberdayakan Pengguna Untuk Membuat Video Melalui Pembuatan Teks-ke-Video muncul pertama pada Metaverse Post.