arxiv DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

/documents/75165/

基本信息

文件基本信息

名称
DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection
描述
我们提出了 DINO(\textbf{D}ETR,带有 \textbf{I}mproved de\textbf{N}oising anch\textbf{O}r box),这是一种最先进的端到端目标检测器。 % 在本文中。 DINO 通过使用对比方式进行去噪训练、用于锚点初始化的混合查询选择方法以及用于框预测的前瞻两次方案,在性能和效率上比以前的 DETR 类模型有所改进。 DINO 在具有 ResNet-50 主干和多尺度特征的 COCO 上,在 $12$ 时期内实现了 $49.4$AP,在 $24$ 时期内实现了 $51.3$AP,与之前最好的 DN-DETR 相比,分别显着提高了 $\textbf{+6.0}$\textbf{AP} 和 $\textbf{+2.7}$\textbf{AP}类似 DETR 的模型。 DINO 在模型大小和数据大小方面都具有良好的扩展性。没有花哨的东西,在具有 SwinL 主干的 Objects365 数据集上进行预训练后,DINO 在 COCO \texttt{val2017} ($\textbf{63.2}$\textbf{AP}) 和 \texttt{test-dev} (\textbf{$\textbf{63.3}$AP}) 上获得了最佳结果。与排行榜上的其他模型相比,DINO 显着减小了模型大小和预训练数据大小,同时取得了更好的结果。我们的代码将在 \url{this https URL} 中提供 ...