谷歌宣布了其在人工智能领域的最新突破:See,一款即将改变视频生成器行业的全新创新型文本转视频生成器。当 Veo 在谷歌 I/O 开发者大会上亮相时,它被认为是 OpenAI 的 Sora 的强劲竞争对手,其优势包括扩大创意控制范围和生成令人惊叹的视觉输出。

Veo 在视频生成中的创造力

与以往的 AI 视频生成器不同,Veo 拥有无与伦比的功能——创意控制;用户可以制作具有更精细细节和电影效果的视频。利用其复杂的自然语言理解,Veo 可以轻松理解更长的提示和电影术语的含义,包括“延时拍摄”和“航拍镜头”。

对概念的更深入理解有助于使用者以准确且精确的方式描述他们的想法;因此,制作的影片更有可能比同类影片更令人印象深刻。

Veo 最引人注目的元素之一是保证所产生场景的连续性和真实性。在影片生成中,Veo 正在解决镜头不一致的问题,它能够产生具有自然运动的镜头,无论是人类、动物还是物体。这项值得注意的技巧提高了整体观看体验,使观众感觉自己身处在完全真实渲染的现实场景中。

谷歌在AI视频生成方面的持续创新

Veo 是 Google 的影片世代,是过去几年该领域研究和开发的成果。该专案的基础知识已经由 Veo 先前的专案开发,例如 Imagen-Video、VideoPoet 和 Lumiere。

在人工智慧的帮助下,Veo 在视觉叙事方面将比以前走得更远。透过结合这些专案中的经验教训和新想法,Veo 将成为 Google 致力于最佳人工智慧技术的典范。

尽管 Veo 演示已经完成,但尚未向公众展示。相反,Google正在其影片编辑平台VideoFX中向有限数量的VideoFX创作者提供Veo影片助理。那些真正对此感兴趣的人可以注册候补名单,并有机会成为 Veo 体验的一部分并利用其革命性潜力。

除了 Veo 之外,Google还推出了 Imagen 3,这是其最新的文字到图像模型,以其出色的图像品质和更少的视觉伪影而闻名。热衷于了解 Imagen 3 可能性的创作者可以注册候补名单,从而获得这项最新技术。