以其內容社群和社交平台而聞名的中國科技公司快手科技推出了Kling AI,這是一款旨在根據文字提示生成高度逼真的影片的新工具,是OpenAI Sora模型的潛在競爭對手。
Sora 是一種人工智慧模型,旨在根據文字輸入生成逼真且富有創意的場景。 Sora 視訊生成功能的核心是深度學習框架。此模型學習單字和短語與各種元素(例如物件、動作、環境和風格細微差別)之間的關聯。
OpenAI 的 Sora 模型能夠產生長達一分鐘的視頻,而 Kling AI 可以產生長達兩分鐘、1080p 解析度、每秒 30 幀的逼真視頻。它支援多種寬高比,並透過先進的 3D 臉部和身體重建技術實現高水準的細節,確保其 AI 生成的影片與真實鏡頭幾乎無法區分。
Kling AI 利用 3D 變分自動編碼器 (VAE) 來重建臉部和身體,從而能夠從單一全身影像產生詳細的表情和肢體運動。該技術透過 3D 時空聯合注意力機制得到增強,增強了模型處理複雜場景和運動的能力。這確保了生成的內容與物理定律一致。
該應用程式採用開放存取方式,但存在區域限制。該模型目前正處於試驗階段。
不到 48 小時前,Sora 的競爭對手 Kling 落敗。
人們已經開始接觸並製作狂野的人工智慧影片。
1. MadMax 啤酒廣告僅用 1 小時製作 pic.twitter.com/CyKm2aI0It
- Min Choi (@minchoi) 2024 年 6 月 8 日
快手科技推出KwaiYii LLM與Kolors文字轉圖像模型
快手科技是幾家競相推出 Sora 替代品的中國科技公司之一。繼 5 月推出 KwaiYii 大語言模型 (LLM) 和文字到圖像模型 Kolors 後,文字轉視訊功能代表了其最新的人工智慧創新。
此外,「AI舞者」功能可在快手科技應用程式和影片製作應用程式快影中使用,使用戶能夠上傳靜態照片並產生角色按照指定節奏和動作跳舞的影片。
快手科技揭秘Kling AI,賦能用戶透過文字轉視頻生成視頻,首發於元界貼文。