我们推出 Imagen,一种文本到图像的扩散模型,具有前所未有的照片真实感和深层次的语言理解。 Imagen 建立在大型 Transformer 语言模型在理解文本方面的能力之上,并依赖于扩散模型在高保真图像生成方面的能力。我们的关键发现是通用的大语言模型(例如 ...

0 0 0 0 2024/04/26 arXiv:2205.11487v1 heuwangchao

生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而,当前大多数基于扩散模型的风格转移方法通常涉及缓慢的迭代优化过程,例如 ...

0 0 0 0 2024/04/08 arXiv:2401.15636v1 heuwangchao

大规模文本到图像(T2I)模型令人难以置信的生成能力展示了学习复杂结构和有意义语义的强大能力。然而,仅仅依靠文本提示并不能充分利用模型所学到的知识,尤其是在进行灵活准确的控制时(例如: ...

0 0 0 0 2024/04/07 arXiv:2302.08453v2 heuwangchao

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)