arxiv FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

名称
FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction
首页
https://yiyibooks.cn/arxiv/2409.18071v1/index.html
原始地址
https://arxiv.org/abs/2409.18071
描述
在图像编辑中引入用户指定的视觉概念是高度实用的,因为这些概念比基于文本的描述更精确地传达了用户的意图。我们提出了FreeEdit,这是一种实现此类基于参考的图像编辑的新颖方法,它可以根据用户友好的语言指令准确地从参考图像中重现视觉概念。我们的方法利用多模式指令编码器编码语言说明来指导编辑过程 ...