Jht的文档

ZegCLIP: Towards Adapting CLIP for Zero-shot Semantic Segmentation

最近，剪辑已通过两阶段方案应用于像素级零击学习任务。一般的想法是首先生成类不足的区域建议，然后喂养裁剪的建议区域以夹夹以利用其图像级零摄像分类能力。虽然有效，但这种方案需要两个图像编码器，一个用于提案生成，一个用于剪辑，导致了复杂的管道和高计算成本 ...

0 0 0 0 2025/04/25 arXiv:2212.03588v3 Jht

ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation

遥感中的实例分割算法通常基于常规方法，将其应用程序限制为可见的方案和封闭式预测。在这项工作中，我们提出了一项名为“零光遥感实例”细分的新任务，旨在识别训练数据中缺少的空中对象。当对具有较高的类相似性和类内差异的空中类别进行分类时，就会出现挑战 ...

0 0 0 0 2025/04/25 arXiv:2412.12798v1 Jht

DC-SAM: In-Context Segment Anything in Images and Videos via Dual Consistency

给定单个标记的示例，封闭式分割旨在分割相应的对象。这种设置在几次学习中被称为单发段，探索了分割模型的概括能力，并已应用于各种视觉任务，包括场景理解和图像/视频编辑。尽管最近的任何模型已经实现了最新的任何模型会导致交互式分割，但这些方法并非直接适用于在文章中的细分 ...

0 0 0 0 2025/04/24 arXiv:2504.12080v2 Jht

Vision and Language Reference Prompt into SAM for Few-shot Segmentation

细分任何模型（SAM）代表一个大规模的分割模型，该模型可以通过灵活的提示来实现强大的零击功能。虽然SAM可以将任何对象分割为零，但它需要为每个目标图像提供用户提供的提示，并且不会将任何标签信息附加到掩模。很少有射击分段模型通过将带注释的参考图像作为提示来解决这些问题，并可以在没有用户提供的提示的情况下将特定对象分割为特定对象 ...

0 0 0 0 2025/04/24 arXiv:2502.00719v1 Jht

NTIRE 2025 Challenge on Cross-Domain Few-Shot Object Detection: Methods and Results

当跨域应用时，跨域少数射击对象检测（CD-FSOD）对现有对象检测和几个射击检测模型构成了重大挑战。与NTIRE 2025结合使用，我们组织了第一届CD-FSOD挑战，旨在提高当前对象探测器在完全新颖的目标域上的性能，仅具有有限的标记数据。挑战吸引了152名注册参与者，收到了42支球队的意见书，并结束了13个团队进行有效的最终提交 ...

0 0 0 0 2025/04/20 arXiv:2504.10685v1 Jht

VRP-SAM: SAM with Visual Reference Prompt

在本文中，我们提出了一个新颖的视觉参考提示（VRP）编码器，该编码器授权该段的任何模型（SAM）利用带注释的参考图像作为分割的提示，创建VRP-SAM模型。本质上，VRP-SAM可以利用带注释的参考图像来理解特定对象并在目标图像中对特定对象进行分割。请注意，VRP编码器可以为参考图像提供多种注释格式，包括\ textbf {point}，\ textbf {box}，\ textbf {scribble}和\ textbf {mask} ...

0 0 0 0 2025/04/15 arXiv:2402.17726v3 Jht

Foreground-Covering Prototype Generation and Matching for SAM-Aided Few-Shot Segmentation

我们提出了前景覆盖的原型生成和匹配，以解决少数弹片分割（FSS），该分段旨在根据标记的支持图像在未标记的查询图像中细分目标区域。与先前的研究不同，该研究通常使用支持原型和查询像素来估算查询中的目标区域，我们利用了支持和查询原型之间的关系。为了实现这一目标，我们利用了两个互补功能：用于像素聚合的SAM Image编码器功能和类别一致性的重新连接功能 ...

0 0 0 0 2025/04/09 arXiv:2501.00752v1 Jht

Enhance Then Search: An Augmentation-Search Strategy with Foundation Models for Cross-Domain Few-Shot Object Detection

在诸如接地派和莱迪诺（Lae-Dino）之类的广泛数据集上预估计的基础模型在跨域几乎没有对象检测（CD-FSOD）任务中表现出色。通过严格的几次训练，我们发现基于图像的数据增强技术和基于网格的子域搜索策略的整合显着增强了这些基础模型的性能。在接地迪诺的基础上，我们采用了几种广泛使用的图像增强方法，并建立了优化目标，以有效地导航宽敞的域空间，以寻找最佳的子域 ...

0 0 0 0 2025/04/09 arXiv:2504.04517v1 Jht

Rethinking Prior Information Generation with CLIP for Few-Shot Segmentation

由于其标签信息对看不见的类别的局限性，几乎没有射击细分仍然具有挑战性。以前的大多数方法都依赖于从冷冻视觉编码器中提取高级特征图来计算像素的相似性，作为解码器的关键先验指南。但是，由于这些高级特征地图具有明显的类别偏见，因此这种先前的表示遭受了粗粒度和对新类别的概括不良 ...

0 0 0 0 2025/03/26 arXiv:2405.08458v1 Jht

Generalization-Enhanced Few-Shot Object Detection in Remote Sensing

由于高分辨率，多尺度特征以及卫星和无人机图像固有的不同地面对象特征，遥感对象检测尤其具有挑战性。这些挑战需要更高级的方法来在这种环境中有效检测。尽管深度学习方法在遥感对象检测中取得了巨大的成功，但它们通常依赖大量标记的数据 ...

0 0 0 0 2025/03/23 arXiv:2501.02474v1 Jht