arxiv GLIGEN: Open-Set Grounded Text-to-Image Generation

名称
GLIGEN: Open-Set Grounded Text-to-Image Generation
首页
https://yiyibooks.cn/arxiv/2301.07093v2/index.html
原始地址
https://arxiv.org/abs/2301.07093
描述
大规模文本到图像的扩散模型取得了惊人的进步。然而,现状是单独使用文本输入,这会妨碍可控性。在这项工作中,我们提出了 GLIGEN(接地语言到图像生成),这是一种基于现有预训练文本到图像扩散模型并扩展其功能的新颖方法,使它们也能够以接地输入为条件 ...