技术发布引人瞩目
张吕民与斯坦福大学的科研团队共同推出了一项创新技术,这一消息发布后,立刻在业界引发了广泛的关注。这项技术通过在视频传播模型中采用固定长度的时域信息,实现了生成更长时间、更高品质的视频,无疑为视频制作领域带来了革命性的变化,众多从事相关研究与应用的专家和人员都热切期待着它的实际应用效果。
实测性能优势明显
构建的130亿参数模型展示出新技术的不凡能力。只需配备一块6GB显存的显卡,即可在60秒内制作视频。以往的视频传播模型至少需要12GB显存,显存不足会使得视频时长缩短、画质降低以及制作时间延长。然而,这项新技术显著降低了显存需求,使得更多普通用户设备能够轻松制作出较长的视频。
架构策略助力生成
这项技术属于神经网络结构类型,运用多层次优化方法实现了AI视频的本地化生成。它的基础是定制版的腾讯混元模型,同时,现有的预训练模型也能借助它进行细微调整和适配。因此,这项技术具备了良好的兼容性和拓展性,不同的开发者与用户都能根据各自需求对模型进行调整,从而拓宽了视频生成应用的范围。
创新方法降低需求
在生成视频时,典型视频扩散模型遇到了显存需求大的难题,每制作一帧,所需的输入帧数会随着视频体积的增大而增多。然而,这项新技术的出现,能根据输入帧的重要性进行压缩,将上下文长度固定,从而大幅减少对显存的依赖。其计算成本与图片扩散模型相近,显著提高了计算速度。
即时预览体验升级
新技术在显存使用和计算资源消耗方面表现优异,而且每一帧画面生成后都能立即呈现,便于用户即时查看。这样的设计极大地方便了用户,在视频制作过程中可以随时掌握进度,遇到问题也能迅速作出调整。此外,它还有助于减少视频长度增加时质量的明显下降。
硬件系统支持情况
该技术在数据格式上支持FP16和BF16,且兼容RTX 50、RTX 40、RTX 30系列显卡,除了RTX 3050 4GB之外,几乎所有现代显卡都能使用。但尚未在RTX 20系列及更早的显卡上进行验证,也没有说明对AMD或Intel处理器的具体要求。此外,它还支持Windows和Linux操作系统。性能方面,RTX 4090经过调整后,每秒能产出大约0.6帧画面。
这项创新技术为视频制作开辟了崭新天地,你预计它今后会在哪些行业大放异彩?欢迎在评论区留下你的看法,同时别忘了点赞并转发这篇文章!
版权说明:本文章为昆明鱼豆网所有,未经允许不得转载。