- 名称
- RainFusion: Adaptive Video Generation Acceleration via Multi-Dimensional Visual Redundancy
- 描述
使用扩散模型的视频生成是高度计算密集的,在扩散 Transformer (DIT)模型中,占总计算资源的80 \%以上的3D注意力。在这项工作中,我们引入了{\ bf RainFusion},这是一种新型的无训练稀疏注意方法,利用视觉数据中固有的稀疏性质以加速注意力计算,同时保持视频质量。具体而言,我们在视频生成注意计算中确定了三个独特的稀疏模式 - 空间模式,时间模式和纹理模式 ...