遥感中的实例分割算法通常基于常规方法,将其应用程序限制为可见的方案和封闭式预测。在这项工作中,我们提出了一项名为“零光遥感实例”细分的新任务,旨在识别训练数据中缺少的空中对象。当对具有较高的类相似性和类内差异的空中类别进行分类时,就会出现挑战 ...

0 0 0 0 2025/04/25 arXiv:2412.12798v1 Jht

给定单个标记的示例,封闭式分割旨在分割相应的对象。这种设置在几次学习中被称为单发段,探索了分割模型的概括能力,并已应用于各种视觉任务,包括场景理解和图像/视频编辑。尽管最近的任何模型已经实现了最新的任何模型会导致交互式分割,但这些方法并非直接适用于在文章中的细分 ...

0 0 0 0 2025/04/24 arXiv:2504.12080v2 Jht

细分任何模型(SAM)代表一个大规模的分割模型,该模型可以通过灵活的提示来实现强大的零击功能。虽然SAM可以将任何对象分割为零,但它需要为每个目标图像提供用户提供的提示,并且不会将任何标签信息附加到掩模。很少有射击分段模型通过将带注释的参考图像作为提示来解决这些问题,并可以在没有用户提供的提示的情况下将特定对象分割为特定对象 ...

0 0 0 0 2025/04/24 arXiv:2502.00719v1 Jht

当跨域应用时,跨域少数射击对象检测(CD-FSOD)对现有对象检测和几个射击检测模型构成了重大挑战。与NTIRE 2025结合使用,我们组织了第一届CD-FSOD挑战,旨在提高当前对象探测器在完全新颖的目标域上的性能,仅具有有限的标记数据。挑战吸引了152名注册参与者,收到了42支球队的意见书,并结束了13个团队进行有效的最终提交 ...

0 0 0 0 2025/04/20 arXiv:2504.10685v1 Jht

在本文中,我们提出了一个新颖的视觉参考提示(VRP)编码器,该编码器授权该段的任何模型(SAM)利用带注释的参考图像作为分割的提示,创建VRP-SAM模型。本质上,VRP-SAM可以利用带注释的参考图像来理解特定对象并在目标图像中对特定对象进行分割。请注意,VRP编码器可以为参考图像提供多种注释格式,包括\ textbf {point},\ textbf {box},\ textbf {scribble}和\ textbf {mask} ...

0 0 0 0 2025/04/15 arXiv:2402.17726v3 Jht

我们提出了前景覆盖的原型生成和匹配,以解决少数弹片分割(FSS),该分段旨在根据标记的支持图像在未标记的查询图像中细分目标区域。与先前的研究不同,该研究通常使用支持原型和查询像素来估算查询中的目标区域,我们利用了支持和查询原型之间的关系。为了实现这一目标,我们利用了两个互补功能:用于像素聚合的SAM Image编码器功能和类别一致性的重新连接功能 ...

0 0 0 0 2025/04/09 arXiv:2501.00752v1 Jht

在诸如接地派和莱迪诺(Lae-Dino)之类的广泛数据集上预估计的基础模型在跨域几乎没有对象检测(CD-FSOD)任务中表现出色。通过严格的几次训练,我们发现基于图像的数据增强技术和基于网格的子域搜索策略的整合显着增强了这些基础模型的性能。在接地迪诺的基础上,我们采用了几种广泛使用的图像增强方法,并建立了优化目标,以有效地导航宽敞的域空间,以寻找最佳的子域 ...

0 0 0 0 2025/04/09 arXiv:2504.04517v1 Jht

由于其标签信息对看不见的类别的局限性,几乎没有射击细分仍然具有挑战性。以前的大多数方法都依赖于从冷冻视觉编码器中提取高级特征图来计算像素的相似性,作为解码器的关键先验指南。但是,由于这些高级特征地图具有明显的类别偏见,因此这种先前的表示遭受了粗粒度和对新类别的概括不良 ...

0 0 0 0 2025/03/26 arXiv:2405.08458v1 Jht

由于高分辨率,多尺度特征以及卫星和无人机图像固有的不同地面对象特征,遥感对象检测尤其具有挑战性。这些挑战需要更高级的方法来在这种环境中有效检测。尽管深度学习方法在遥感对象检测中取得了巨大的成功,但它们通常依赖大量标记的数据 ...

0 0 0 0 2025/03/23 arXiv:2501.02474v1 Jht

多模式大型语言模型(MLLM)通过合并视觉感知接口来扩展大语言模型(LLM)的功能,取得了重大步骤。尽管出现了令人兴奋的应用程序以及各种说明调整数据的可用性,但现有方法通常依赖于剪辑或其变体作为视觉分支,而仅从深层中提取功能。但是,这些方法缺乏对MLLM中视觉编码器的全面分析 ...

0 0 0 0 2025/03/19 arXiv:2310.08825v3 Jht

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)