继此前在今年4月,国内AI初创企业生数科技与清华大学联合发布原创视频大模型Vidu后,日前生数科技方面宣布对Vidu进行更新,并推出“主体参照”功能。据悉,该功能够实现对任意主体的一致性生成,让视频生成更加稳定、可控,并且已面向用户免费开放。目前,Vidu也是全球首个支持该能力的视频大模型。
具体而言,“主体参照”功能允许用户上传任意主体的一张图片,利用Vidu锁定该主体的形象,并通过描述词任意切换场景,输出主体一致的视频。此外该功能不局限于单一对象,在面向“任意主体”时,包括人物、动物、商品以及动漫角色和虚构主体,都能确保其在视频生成中的一致性和可控性。例如“主体参照”的人物角色,无论是真实人物还是虚构角色,Vidu都能保持其在不同环境中、不同镜头下的形象连贯一致。
对此,生数科技董事长、CEO唐家渝表示,“主体参照”这一全新功能的上线,代表着AI完整叙事的开端,AI视频创作也将迈向更高效、更灵活的阶段。无论是制作短视频、动画作品还是广告片,在叙事的艺术中,一个完整的叙事体系是“主体一致、场景一致、风格一致”等要素的有机结合。
唐家渝还进一步指出,从更长远的视角来看,一旦实现了全面的可控性,视频创作行业将经历一场颠覆性的变革。届时角色、场景、风格,甚至镜头运用、光影效果等元素,都将转化为可灵活调整的参数,用户只需要动动手指、调调参数,就可以完成一部影像作品的创作,而每一部作品的背后,也将是用户基于AI构建出的独特世界观和自我表达。
此外生数科技方面透露,后续Vidu将继续探索如何精确控制多主体交互、风格统一、多变场景稳定切换等复杂元素,以满足更高层次的叙事需求。
【本文图片来自网络】