谷歌 DeepMind 刚刚推出了 Veo 2,这是利用人工智能生成视频的新模型。该工具显然正在向高端市场发展,能够制作高达 4K 的视频,与第一代 Veo 的 1080p 相比,这是一个显着的进步,特别是与其主要竞争对手 OpenAI 的 Sora 相比,后者仍限于此分辨率。

更精准、更真实的AI
Veo 2 的主要改进是能够更好地处理视觉细节和复杂的动作。谷歌宣布在现实物理领域取得显着进展,这是视频生成器经常遇到困难的领域。例如,更好地考虑人类手势、阴影甚至液体的运动,这将产生更自然的结果。 Veo 2 还提供更精确的相机控制工具:可以请求特写镜头、使用特定镜头的广角镜头,甚至可以请求景深效果以获得更多电影渲染效果。
Veo 2 vs OpenAI Sora:谷歌占据优势
在技术方面,Veo 2 似乎比。在 Google 进行的内部测试中,59% 的用户更喜欢 Veo 2 制作的视频,而这一比例为 27%。在实践中,Veo 2 剪辑默认限制为 8 秒,但根据使用情况可以延长至 2 分钟以上,。相比之下,Sora 的视频卡在 20 秒,最高分辨率为 1080p。
尽管取得了这些进步,谷歌承认仍然存在一些问题,特别是在复杂动作或小细节的一致性方面。(一如既往地像手或脸)。

数据和道德的敏感问题
谷歌对用于训练 Veo 2 的数据仍然守口如瓶,但一些人怀疑来自对模型做出了贡献。这些信息总是会引发有关使用受版权保护的内容的问题,这对创作者来说是一个非常紧张的话题。为了消除错误信息的风险,Veo 2 还通过 SynthID 技术添加了隐形水印,旨在证明视频的生成来源。

Imagen 3 也有更新
与此同时,Google 改进了其 Imagen 3 图像生成模型,现在能够生成更清晰、组合更佳的视觉效果,更忠实于所提供的描述。它可以处理多种风格,从照片写实主义到动画。这些新功能可通过 ImageFX 工具访问,该工具已在 100 多个国家/地区部署。
凭借 Veo 2,Google DeepMind 在人工智能生成视频市场上取得了重大打击,并领先于 OpenAI。这些工具将如何发展还有待观察,特别是在非常敏感的道德使用问题上。