扩散概率模型(DPM)是新兴的强大生成模型。尽管 DPM 具有高质量的生成性能,但仍然受到采样缓慢的影响,因为它们通常需要对大型神经网络进行数百或数千次顺序功能评估(步骤)才能抽取样本。从 DPM 采样也可以被视为求解相应的扩散常微分方程 (ODE) ...
在这项工作中,我们介绍了一种使用随意捕获的参考视频在 3D 生成的高斯中创建可控动态的新颖方法。我们的方法将对象的运动从参考视频传输到不同类别的各种生成的 3D 高斯,确保精确且可定制的运动传输。我们通过采用基于混合蒙皮的非参数形状重建来提取参考对象的形状和运动来实现这一目标 ...
视频生成模型因其生成逼真且富有想象力的帧的能力而受到特别关注。此外,这些模型还表现出很强的 3D 一致性,显着增强了它们作为世界模拟器的潜力。在这项工作中,我们提出了 Vidu4D,一种新颖的重建模型,擅长精确重建 4D(即三维) ...
我们引入有界生成作为一种通用任务来控制视频生成,以仅基于给定的开始和结束帧来合成任意相机和主体运动。我们的目标是充分利用图像到视频模型固有的泛化能力,而无需对原始模型进行额外的训练或微调。这是通过提出的新采样策略(我们称之为时间反转融合)来实现的,该策略分别融合了以开始帧和结束帧为条件的时间前向和后向去噪路径 ...