arxiv RainFusion: Adaptive Video Generation Acceleration via Multi-Dimensional Visual Redundancy

名称
RainFusion: Adaptive Video Generation Acceleration via Multi-Dimensional Visual Redundancy
首页
https://yiyibooks.cn/arxiv/2505.21036v1/index.html
原始地址
https://arxiv.org/pdf/2505.21036
描述
使用扩散模型的视频生成是高度计算密集的,在扩散 Transformer (DIT)模型中,占总计算资源的80 \%以上的3D注意力。在这项工作中,我们引入了{\ bf RainFusion},这是一种新型的无训练稀疏注意方法,利用视觉数据中固有的稀疏性质以加速注意力计算,同时保持视频质量。具体而言,我们在视频生成注意计算中确定了三个独特的稀疏模式 - 空间模式,时间模式和纹理模式 ...