人体动作生成是动画和视频制作的基石技术,在文本到动作和音乐到舞蹈等各种任务中有着广泛的应用。以前的工作重点是开发为每项任务量身定制的专业模型,但没有可扩展性。在这项工作中,lmm),这是一种以运动为中心的多模式框架,它将主流运动生成任务统一为通用模型... ...
这些笔记构成了一种最佳运输理论速成课程。从凸对偶问题开始,讨论了 Monge-Kantorovitch 问题的不同特征。详细描述了由最佳传输引起的距离 $W_p$ 赋予的概率测度空间的主要属性 ...
基于分数的扩散模型已被证明在图像生成方面是有效的,并得到了广泛的应用;然而,导致随机和确定性(即概率流 ODE)采样方案之间性能差异的根本因素仍不清楚 ...
我们提出了一种条件随机插值(CSI)方法来学习条件分布。 CSI 学习概率流方程或随机微分方程,将参考分布传输到目标条件分布。这是通过首先学习基于条件随机插值的漂移函数和条件得分函数来实现的,然后使用它们构建由常微分方程或条件采样的扩散过程控制的确定性过程 ...
给定一组 $K$ 概率密度,我们考虑学习联合分布的多边际生成建模问题,该联合分布将这些密度恢复为边际。这种联合分布的结构应该识别指定边际之间的多向对应关系。我们在随机插值框架的推广中形式化了完成此任务的方法,从而产生了基于动态测量传输的高效学习算法 ...
扩散模型是强的生成模型,它使用随机过程将噪声映射到数据。然而,对于许多应用程序(例如图像编辑),模型输入来自于分布不是随机噪声。因此,扩散模型必须依靠指导或预测采样等繁琐的方法来将这些信息纳入生成过程... ...
提出了一种基于任意一对基本概率密度和目标概率密度之间的连续时间归一化流的生成模型。该流的速度场是根据在有限时间内在基础和目标之间插值的时间相关密度的概率电流推断出来的。与基于最大似然原理的传统归一化流推理方法不同,传统的归一化流推理方法需要通过 ODE 求解器进行昂贵的反向传播,而我们的插值方法会导致速度本身产生简单的二次损失,该损失以易于经验估计的期望表示 ...
引入了一类统一基于流和基于扩散的方法的生成模型。这些模型扩展了 Albergo & Vanden-Eijnden (2023) 中提出的框架,使得能够使用称为“随机插值”的广泛连续时间随机过程在有限时间内精确地桥接任意两个任意概率密度函数。这些插值是通过将两个规定密度的数据与以灵活的方式塑造桥梁的附加潜在变量相结合而构建的 ...
这是一篇关于梯度流理论的说明性论文,特别是那些可以解释为概率测度空间(由最优传输引起的距离)的 Wasserstein 度量的梯度流的偏微分方程。根据 Ambrosio、Gigli 和 Savar{é} 的工作,起点是欧几里得理论,然后将其推广到度量空间。然后是对 Wasserstein 理论的独立阐述,简要介绍了所需的最佳运输工具和测地线凸性的概念,然后是对 Jordan-Kinderleher-Otto 方案的精确描述,并证明了最简单的情况:线性福克-普朗克方程 ...
该演示涵盖了拓扑和测度理论的先决条件结果。然后介绍耦合和最佳传输的基本定义。然后引入坎特罗洛维奇问题并提出存在定理 ...