Kuaishou Technology Unveils Kling AI, Empowering Users To Create Videos Via Text-to-Video Generation

Čínská technologická společnost Kuaishou Technology, známá svou obsahovou komunitou a sociální platformou, představila Kling AI, nový nástroj určený k vytváření vysoce realistických videí z textových výzev, který představuje potenciálního konkurenta modelu Sora od OpenAI.

Sora je model umělé inteligence navržený tak, aby generoval realistické a kreativní scény založené na textovém vstupu. Středobodem možností generování videa společnosti Sora je rámec hlubokého učení. Model se učí asociace mezi slovy a frázemi s různými prvky, jako jsou předměty, akce, prostředí a stylistické nuance.

Zatímco model Sora od OpenAI je schopen generovat videa o délce až jedné minuty, Kling AI dokáže produkovat realistická videa dosahující až dvou minut s rozlišením 1080p při 30 snímcích za sekundu. Podporuje více poměrů stran a dosahuje vysoké úrovně detailů prostřednictvím pokročilých technik 3D rekonstrukce obličeje a těla, což zajišťuje, že jeho videa generovaná AI jsou prakticky nerozeznatelná od skutečných záběrů.

Kling AI využívá 3D Variational Autoencoder (VAE) k rekonstrukci tváří a těl, což umožňuje generování detailních výrazů a pohybů končetin z jediného snímku celého těla. Tato technologie je vylepšena 3D mechanismem časoprostorové společné pozornosti, který zlepšuje schopnost modelu zvládat složité scény a pohyby. Tím je zajištěno, že vygenerovaný obsah zachová konzistenci s fyzikálními zákony.

Aplikace využívá přístup otevřeného přístupu, i když s regionálními omezeními. Model je v současné době funkční ve zkušební fázi.

Před méně než 48 hodinami vypadl konkurent Sora Kling.

Lidé již mají přístup a vytvářejí divoká videa AI. 🤯

1. Reklama na pivo MadMax vytvořená za 1 hodinupic.twitter.com/CyKm2aI0It

– Min Choi (@minchoi) 8. června 2024

Technologie Kuaishou odhaluje model KwaiYii LLM a Kolors Text-to-Image

Kuaishou Technology patří mezi několik čínských technologických společností, které soutěží o zavedení alternativ k Sora. Schopnost převodu textu na video představuje nejnovější inovaci umělé inteligence po představení modelu velkého jazyka KwaiYii (LLM) a modelu převodu textu na obrázek Kolors, který debutoval v květnu.

Kromě toho funkce „AI Dancer“, dostupná v rámci aplikace Kuaishou Technology a aplikace pro produkci videa Kwaiying, umožňuje uživatelům nahrát statickou fotografii a generovat videa zobrazující postavu tančící podle určených rytmů a pohybů.

The post Kuaishou Technology odhaluje Kling AI, umožňuje uživatelům vytvářet videa prostřednictvím generování textu na video appeared first on Metaverse Post.