谷歌宣佈了其在人工智能領域的最新突破:See,一款即將改變視頻生成器行業的全新創新型文本轉視頻生成器。當 Veo 在谷歌 I/O 開發者大會上亮相時,它被認爲是 OpenAI 的 Sora 的強勁競爭對手,其優勢包括擴大創意控制範圍和生成令人驚歎的視覺輸出。

Veo 在視頻生成中的創造力

與以往的 AI 視頻生成器不同,Veo 擁有無與倫比的功能——創意控制;用戶可以製作具有更精細細節和電影效果的視頻。利用其複雜的自然語言理解,Veo 可以輕鬆理解更長的提示和電影術語的含義,包括“延時拍攝”和“航拍鏡頭”。

對概念的更深入理解有助於使用者以準確且精確的方式描述他們的想法;因此,製作的影片更有可能比同類影片更令人印象深刻。

Veo 最引人注目的元素之一是保證所產生場景的連續性和真實性。在影片生成中,Veo 正在解決鏡頭不一致的問題,它能夠產生具有自然運動的鏡頭,無論是人類、動物還是物體。這項值得注意的技巧提高了整體觀看體驗,使觀眾感覺自己身處在完全真實渲染的現實場景中。

谷歌在AI視頻生成方面的持續創新

Veo 是 Google 的影片世代,是過去幾年該領域研究和開發的成果。該專案的基礎知識已經由 Veo 先前的專案開發,例如 Imagen-Video、VideoPoet 和 Lumiere。

在人工智慧的幫助下,Veo 在視覺敘事方面將比以前走得更遠。透過結合這些專案中的經驗教訓和新想法,Veo 將成為 Google 致力於最佳人工智慧技術的典範。

儘管 Veo 演示已經完成,但尚未向公眾展示。相反,Google正在其影片編輯平台VideoFX中向有限數量的VideoFX創作者提供Veo影片助理。那些真正對此感興趣的人可以註冊候補名單,並有機會成為 Veo 體驗的一部分並利用其革命性潛力。

除了 Veo 之外,Google還推出了 Imagen 3,這是其最新的文字到圖像模型,以其出色的圖像品質和更少的視覺偽影而聞名。熱衷於了解 Imagen 3 可能性的創作者可以註冊候補名單,從而獲得這項最新技術。