启动跑道揭开了Gen-4,这是一个新的人工智能模型,能够从文本中生成视频。该工具的区别是可以更好地管理场景之间的视觉连续性,并允许您创建具有连贯的字符和装饰的剪辑,这是令人惊叹的。

旨在平滑不一致之处的模型
跑道继续改善其视频生成工具。 Gen-1于2023年初推出后,这家初创企业已经宣布Gen-4是其新的AI模型,旨在从文本提示中创建视频。与以前的版本相比,主要差异涉及视觉连续性:Gen-4应该在字符,对象和环境方面保持计划之间的一致性。
该模型基于扩散系统,一种已经用于生成图像的方法。在这里,它适用于视频,该视频仍然是一系列图像,并具有所暗示的其他约束。为了产生流体序列,Gen-4结合了特定的模块,以确保从一个计划到另一个计划具有一定的稳定性。

使用参考图像
用户可以提供字符或对象的参考图像,然后编写文本指令来指导一代。Gen-4然后支持剪辑的生产,并在不同的情况下保留参考元件的外观。可以改变相机的角度,照明或装饰,而不会失去其视觉特征。
除了视频外,Gen-4还提供图像编辑功能。该工具可以合并两个插图,也可以生成相同视觉的几种变体。这些功能集成到单个接口中,付费订户已经可以访问。

首先用例和当前限制
目前,该生成仅限于720p分辨率的5到10秒的夹。跑道显示了更长的视频,但它们是由几个序列的手动组件造成的。这仍然是预期未来改进的良好指标。
该公司已经在娱乐行业,尤其是与Lionsgate签署了合作伙伴关系。它的工具已用于某些商业项目,例如广告或音乐会视觉效果。与往常一样,培训数据的问题仍然很敏感。跑道,,由于未经授权使用了受保护的内容而受到投诉的针对性。