heuwangchao的文档

heuwangchao

个性签名 ...

我们推出 Imagen，一种文本到图像的扩散模型，具有前所未有的照片真实感和深层次的语言理解。 Imagen 建立在大型 Transformer 语言模型在理解文本方面的能力之上，并依赖于扩散模型在高保真图像生成方面的能力。我们的关键发现是通用的大语言模型（例如 ...

0 0 0 0 2024/04/26 arXiv:2205.11487v1 heuwangchao

生成扩散模型的快速发展极大地推进了风格迁移领域的发展。然而，当前大多数基于扩散模型的风格转移方法通常涉及缓慢的迭代优化过程，例如 ...

0 0 0 0 2024/04/08 arXiv:2401.15636v1 heuwangchao

大规模文本到图像（T2I）模型令人难以置信的生成能力展示了学习复杂结构和有意义语义的强大能力。然而，仅仅依靠文本提示并不能充分利用模型所学到的知识，尤其是在进行灵活准确的控制时（例如： ...

0 0 0 0 2024/04/07 arXiv:2302.08453v2 heuwangchao