跑道出现了Gen-4，他的视频IA押注图像一致性，而且非常疯狂（视频）

2025-04-02

启动跑道揭开了Gen-4，这是一个新的人工智能模型，能够从文本中生成视频。该工具的区别是可以更好地管理场景之间的视觉连续性，并允许您创建具有连贯的字符和装饰的剪辑，这是令人惊叹的。

旨在平滑不一致之处的模型

跑道继续改善其视频生成工具。 Gen-1于2023年初推出后，这家初创企业已经宣布Gen-4是其新的AI模型，旨在从文本提示中创建视频。与以前的版本相比，主要差异涉及视觉连续性：Gen-4应该在字符，对象和环境方面保持计划之间的一致性。

该模型基于扩散系统，一种已经用于生成图像的方法。在这里，它适用于视频，该视频仍然是一系列图像，并具有所暗示的其他约束。为了产生流体序列，Gen-4结合了特定的模块，以确保从一个计划到另一个计划具有一定的稳定性。

使用参考图像

用户可以提供字符或对象的参考图像，然后编写文本指令来指导一代。Gen-4然后支持剪辑的生产，并在不同的情况下保留参考元件的外观。可以改变相机的角度，照明或装饰，而不会失去其视觉特征。

除了视频外，Gen-4还提供图像编辑功能。该工具可以合并两个插图，也可以生成相同视觉的几种变体。这些功能集成到单个接口中，付费订户已经可以访问。

首先用例和当前限制

目前，该生成仅限于720p分辨率的5到10秒的夹。跑道显示了更长的视频，但它们是由几个序列的手动组件造成的。这仍然是预期未来改进的良好指标。

该公司已经在娱乐行业，尤其是与Lionsgate签署了合作伙伴关系。它的工具已用于某些商业项目，例如广告或音乐会视觉效果。与往常一样，培训数据的问题仍然很敏感。跑道，，由于未经授权使用了受保护的内容而受到投诉的针对性。