arxiv Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

名称
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
首页
https://yiyibooks.cn/arxiv/2205.11487v1/index.html
原始地址
https://arxiv.org/pdf/2205.11487.pdf
描述
我们推出 Imagen,一种文本到图像的扩散模型,具有前所未有的照片真实感和深层次的语言理解。 Imagen 建立在大型 Transformer 语言模型在理解文本方面的能力之上,并依赖于扩散模型在高保真图像生成方面的能力。我们的关键发现是通用的大语言模型(例如 ...