- 名称
- PETR: Position Embedding Transformation for Multi-View 3D Object Detection
- 描述
在本文中,我们开发了用于多视图 3D 对象检测的位置嵌入变换 (PETR)。 PETR 将 3D 坐标的位置信息编码为图像特征,产生 3D 位置感知特征。对象查询可以感知 3D 位置感知特征并执行端到端对象检测。 PETR 在标准 nuScenes 数据集上实现了最先进的性能(50.4% NDS 和 44.1% mAP),并在基准测试中排名第一。它可以作为未来研究的简单而强大的基线。代码可在 \url{此 https URL} 获取 ...