目标检测的弱监督学习是图像理解中的一个重要问题,目前还没有令人满意的解决方案。在本文中,我们通过利用在大规模图像级分类任务上预训练的深度卷积神经网络的强大功能来解决这个问题。我们提出了一种弱监督的深度检测架构,该架构将这样的网络修改为在图像区域级别上运行,同时执行区域选择和分类 ...
我们分析了基于 DETR 的半监督目标检测(SSOD)框架,并观察到:(1)当伪真实边界框不准确时,一对一分配策略会生成错误匹配,导致训练效率低下; (2) 基于 DETR 的检测器缺乏输入查询与其预测输出之间的确定性对应关系,这阻碍了当前 SSOD 方法中广泛使用的基于一致性的正则化的适用性。我们提出了 Semi-DETR,这是第一个基于 Transformer 的端到端半监督对象检测器,来解决这些问题。具体来说,我们提出了一种 Stage-wise Hybrid Matching 策略,该策略结合了一对多分配和一对一分配策略,以提高第一阶段的训练效率,从而为训练阶段提供高质量的伪标签。第二阶段 ...