扩散模型作为一种新颖的生成范式,在图像修复、图像到文本翻译和视频生成等各种图像生成任务中取得了显着的成功。图生成是图上的一项重要计算任务,具有众多实际应用。它的目的是学习给定图的分布,然后生成新图 ...
这项调查回顾了文本到图像的扩散模型,因为扩散模型已经在广泛的生成任务中流行起来。作为一项独立的工作,本调查首先简要介绍基本扩散模型如何用于图像合成,然后介绍条件或指导如何改善学习。在此基础上,我们对文本条件图像合成的最先进方法进行了回顾,即 ...
当人类阅读特定文本时,他们通常会想象出相应的图像,我们希望计算机也能做到这一点。文本到图像合成(T2I)专注于从文本描述生成高质量图像,已成为人工智能生成内容(AIGC)的一个重要方面,也是人工智能研究的变革方向。基础模型在 T2I 中发挥着至关重要的作用 ...
自大型语言模型(LLM)兴起以来,多生成代理系统(MGAS)已成为研究热点。然而,随着新的相关作品的不断涌入,现有的评论很难全面地捕捉它们。本文对这些研究进行了全面的调查 ...
我们提出了一种深度学习框架,用于对复杂的高维密度进行建模,称为非线性独立分量估计(NICE)。它基于这样的想法:良好的表示是数据具有易于建模的分布的表示。为此,学习数据的非线性确定性变换,将其映射到潜在空间,以使变换后的数据符合分解分布,即 ...
随着ChatGPT的兴起,大型模型的使用量显着增加,迅速在行业内崛起并席卷整个互联网。本文是对大型模型的微调方法的全面回顾。本文研究了任务自适应微调、领域自适应微调、小样本学习、知识蒸馏、多任务学习、参数高效微调等方面的最新技术进展和先进方法的应用,以及动态微调 ...
受限玻尔兹曼机(RBM)是一种基于能量的两层模型,它利用其隐藏-可见连接来学习可见单元的底层分布,这些单元的相互作用通常因高阶相关性而变得复杂。先前对小系统尺寸伊辛模型的研究表明,RBM 能够准确学习玻尔兹曼分布并在远离临界点 $T_c$ 的温度下重建热量。然而,RBM 如何编码玻尔兹曼分布并捕获相变尚未得到很好的解释 ...
大语言模型(LLM)代理在各个领域表现出了卓越的能力,受到学术界和工业界的广泛关注。然而,由于这些代理的自主性和非确定性行为以及不断进化的性质,引起了人们对人工智能安全的严重担忧。从 DevOps 的角度来看,启用代理的可观察性对于确保 AI 安全是必要的,因为利益相关者可以深入了解代理的内部工作原理,从而使他们能够主动了解代理、检测异常并防止潜在的故障 ...
当前的深度神经网络高度过度参数化(高达数十亿个连接权重)并且是非线性的。然而,它们可以通过梯度下降算法的变体几乎完美地拟合数据,并在不过度拟合的情况下达到意想不到的预测精度水平。这些令人敬畏的结果违背了统计学习的预测,并对非凸优化提出了概念上的挑战 ...
广义线性模型 (GLM) 出现在高维机器学习、统计、通信和信号处理中。在本文中,我们分析数据矩阵随机时的 GLM,这与压缩感知、纠错码或神经网络中的基准模型等问题相关。我们评估互信息(或“自由熵”),从中推导出贝叶斯最优估计和泛化误差 ...