arxiv CRIS: CLIP-Driven Referring Image Segmentation

名称
CRIS: CLIP-Driven Referring Image Segmentation
首页
https://yiyibooks.cn/arxiv/2111.15174v2/index.html
原始地址
https://arxiv.org/abs/2111.15174
描述
参考图片分割旨在通过自然语言将引用率划分为本http url到文本和图像之间的不同数据属性,对于网络而言,良好地对齐文本和像素级特征是一项挑战。现有的方法使用预验证的模型来促进学习,但分别从验证的模型中传递了语言/视觉知识,而忽略了多模式的相应信息。受到对比的语言图像预处理(剪辑)的最新进展的启发,我们在本文中提出了一个端到端夹子驱动的参考图像分割框架(CRIS) ...