人类智能的特征是我们能够吸收和运用周围世界知识的能力,尤其是在以先验知识为基础的最小例子中迅速获取新概念的能力。很少有射击学习(FSL)旨在通过实现明显的概括和可传递性来模仿这种能力。但是,传统的FSL框架通常依赖于清洁,完整和静态数据的假设,这些假设很少在现实世界环境中满足 ...
几次分割(FSS)的最新进步已利用查询和支持功能之间的像素匹配,通常基于交叉注意,这些杂志可以选择性地激活与同类支持FG功能相对应的查询前景(FG)功能。但是,由于主链深层中的较大接收场,提取的查询和支持FG特征不可避免地与背景(BG)特征混合在一起,从而阻碍了FG-FG匹配的交叉注意。因此,查询FG功能与较少的支持FG功能融合在一起 ...
最近,很少开发了很少的射击分割(FSS)。大多数以前的作品都在努力通过从分类任务得出的元学习框架实现概括。但是,受过训练的模型偏向于看见的类,而不是理想地是班级不可或缺的,从而阻碍了对新概念的认可。本文提出了一个新鲜而直接的见解,以减轻问题 ...
最近提出的伪装物体检测(COD)试图分割视觉上融入周围环境的物体,这在现实场景中极其复杂和困难。除了被伪装物体与背景之间具有高度的内在相似性外,这些物体通常尺度多样、外观模糊,甚至被严重遮挡。为了解决这些问题,我们提出了一个混合尺度的三元组网络 \textbf{ZoomNet},它模仿人类在观察模糊图像时的行为,即 ...
现有的少镜头分割方法基于支持查询匹配框架取得了很大的进步。但他们仍然严重受到所提供的少数镜头支持所提供的类内变化有限覆盖的影响。受简单的格式塔原理的启发,即属于同一对象的像素比属于同一类的不同对象的像素更相似,我们提出了一种新颖的自支持匹配策略来缓解这个问题,该策略使用查询原型来匹配查询特征,其中查询原型是从高置信度查询预测中收集的 ...
最近,蒙蔽图像建模取得了重大进展,以赶上蒙蔽语言建模。然而,与 NLP 中的单词不同,图像语义分解的缺乏仍然使得视觉和语言之间的掩码自动编码(MAE)有所不同。在本文中,我们探索了单词的潜在视觉类比,即 ...
Few-shot 语义分割旨在仅用少量带注释的示例来学习分割新的对象类,其在现实世界中具有广泛的应用。大多数现有方法要么关注单向少样本分割的限制性设置,要么遭受对象区域不完全覆盖的困扰。在本文中,我们提出了一种基于原型表示的新颖的少镜头语义分割框架 ...
大规模预训练技术的最新进展显着增强了视觉基础模型的能力,特别是分段任意模型(SAM),它可以根据点和框提示生成精确的掩模。最近的研究将 SAM 扩展到少样本语义分割 (FSS),重点关注基于 SAM 的自动语义分割的提示生成。然而,这些方法难以选择合适的提示,需要针对不同场景进行特定的超参数设置,并且由于过度使用 SAM 而导致一次性推理时间延长,导致效率低下和自动化能力有限 ...
图像分割通常通过针对一组固定的对象类训练模型来解决。稍后合并其他类或更复杂的查询的成本很高,因为它需要在包含这些表达式的数据集上重新训练模型。在这里,我们提出了一个可以在测试时根据任意提示生成图像分割的系统 ...
提出少样本语义分割(FSS)来分割查询图像中不可见的类,仅参考一些名为支持图像的带注释的示例。 FSS 的特征之一是查询和支持目标之间的空间不一致,例如 ...