在这项研究中,我们提出了一种新的 3D 物体检测器,具有值得信赖的深度估计,称为 BEVDepth,用于基于相机的鸟瞰 (BEV) 3D 物体检测。我们的工作基于一个关键的观察——考虑到深度对于相机 3D 检测至关重要这一事实,最近方法中的深度估计令人惊讶地不足。我们的 BEVDepth 通过利用显式深度监督解决了这个问题 ...

0 0 0 0 2024/04/24 arXiv:2206.10092v2 zxddddd

当前的 3D 对象检测模型遵循单一数据集特定的训练和测试范例,当直接部署在另一个数据集中时,通常会面临严重的检测精度下降。在本文中,我们研究了从多个数据集训练统一 3D 检测器的任务。我们观察到这似乎是一项具有挑战性的任务,这主要是因为这些数据集呈现出由不同激光雷达类型和数据采集标准引起的巨大数据级别差异和分类级别变化 ...

0 0 0 0 2024/04/24 arXiv:2303.06880v2 zxddddd

在本文中,我们提出了一种鲁棒的 3D 检测器,名为 Cross Modal Transformer (CMT),用于端到端 3D 多模态检测。无需显式视图变换,CMT 将图像和点云标记作为输入,直接输出准确的 3D 边界框。多模态标记的空间对齐是通过将 3D 点编码为多模态特征来执行的 ...

0 0 0 0 2024/04/24 arXiv:2301.01283v3 zxddddd

在资源有限的无人机(UAV)平台上,低延迟的无人机图像目标检测是一项重要但具有挑战性的任务。本文研究了基于稀疏卷积的检测头优化,证明可以有效平衡精度和效率。然而,它存在对微小物体的上下文信息整合不充分以及在存在不同尺度的前景时对掩模比率的笨拙控制的问题 ...

0 0 0 0 2024/04/24 arXiv:2303.14488v1 zxddddd

来自视觉传感器的 3D 物体检测是机器人系统的基础功能。最先进的方法侧重于从多视图相机输入中推理和解码对象边界框。在这项工作中,我们从多视图一致性在 3D 场景理解和几何学习中的不可或缺的作用中获得了直觉 ...

0 0 0 0 2024/04/24 arXiv:2303.14548v2 zxddddd

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)