去噪扩散概率模型 (DDPM) 可以生成高质量的样本,例如图像和音频样本。然而,DDPM 需要数百到数千次迭代才能生成最终样本。之前的几项工作已经通过调整方差计划(例如, ...
在机器学习和生物学的融合中,我们揭示了扩散模型是进化算法。通过将进化视为去噪过程并将逆进化视为扩散,我们从数学上证明了扩散模型本质上执行进化算法,自然地包含选择、突变和生殖隔离。基于这种等价性,我们提出了扩散进化方法:一种利用迭代去噪的进化算法(最初是在扩散模型的背景下引入的)来启发式地细化参数空间中的解决方案 ...
去噪扩散模型在图像编辑中表现出了出色的性能。现有的作品倾向于使用图像引导方法(提供视觉参考,但缺乏对语义一致性的控制)或文本引导方法(确保忠实于文本引导,但缺乏视觉质量)。为了解决这个问题,我们提出了零样本反演过程(ZIP),该框架将生成的视觉参考和文本引导的融合注入到 \textit{frozen} 预训练扩散模型的语义潜在空间中 ...
扩散模型作为一种新颖的生成范式,在图像修复、图像到文本翻译和视频生成等各种图像生成任务中取得了显着的成功。图生成是图上的一项重要计算任务,具有众多实际应用。它的目的是学习给定图的分布,然后生成新图 ...
这项调查回顾了文本到图像的扩散模型,因为扩散模型已经在广泛的生成任务中流行起来。作为一项独立的工作,本调查首先简要介绍基本扩散模型如何用于图像合成,然后介绍条件或指导如何改善学习。在此基础上,我们对文本条件图像合成的最先进方法进行了回顾,即 ...
当人类阅读特定文本时,他们通常会想象出相应的图像,我们希望计算机也能做到这一点。文本到图像合成(T2I)专注于从文本描述生成高质量图像,已成为人工智能生成内容(AIGC)的一个重要方面,也是人工智能研究的变革方向。基础模型在 T2I 中发挥着至关重要的作用 ...
自大型语言模型(LLM)兴起以来,多生成代理系统(MGAS)已成为研究热点。然而,随着新的相关作品的不断涌入,现有的评论很难全面地捕捉它们。本文对这些研究进行了全面的调查 ...
我们提出了一种深度学习框架,用于对复杂的高维密度进行建模,称为非线性独立分量估计(NICE)。它基于这样的想法:良好的表示是数据具有易于建模的分布的表示。为此,学习数据的非线性确定性变换,将其映射到潜在空间,以使变换后的数据符合分解分布,即 ...
随着ChatGPT的兴起,大型模型的使用量显着增加,迅速在行业内崛起并席卷整个互联网。本文是对大型模型的微调方法的全面回顾。本文研究了任务自适应微调、领域自适应微调、小样本学习、知识蒸馏、多任务学习、参数高效微调等方面的最新技术进展和先进方法的应用,以及动态微调 ...
受限玻尔兹曼机(RBM)是一种基于能量的两层模型,它利用其隐藏-可见连接来学习可见单元的底层分布,这些单元的相互作用通常因高阶相关性而变得复杂。先前对小系统尺寸伊辛模型的研究表明,RBM 能够准确学习玻尔兹曼分布并在远离临界点 $T_c$ 的温度下重建热量。然而,RBM 如何编码玻尔兹曼分布并捕获相变尚未得到很好的解释 ...