X射线图像中的违禁物品检测是广泛应用于各种安检场景中最重要、最有效的方法之一。考虑到 X 射线禁止物品图像中明显的重叠现象,我们提出了一种基于最先进的通用物体检测器 DINO 的防重叠 DETR(AO-DETR)。具体来说,为了解决重叠现象引起的特征耦合问题,我们引入了特定类别一对一分配(CSA)策略来约束特定类别对象查询在预测固定类别的禁止项目时,这可以增强它们的能力从重叠的前景-背景特征中提取特定类别的违禁物品的特征 ...
由于大规模图像尺寸和对象变化,当前基于 CNN 和 Transformer 的遥感图像语义分割方法对于捕获远程依赖性不是最佳的,或者受限于复杂的计算复杂性。在本文中,我们提出了 CM-UNet,包括用于提取局部图像特征的基于 CNN 的编码器和用于聚合和集成全局信息的基于 Mamba 的解码器,促进遥感图像的高效语义分割。具体来说,引入 CSMamba 块来构建核心分割解码器,该解码器采用通道和空间注意力作为 vanilla Mamba 的门激活条件,以增强特征交互和全局局部信息融合 ...
由于输入稀疏且不完整、大量不同尺度的对象以及移动对象固有的标签噪声,训练语义场景完成(SSC)深度模型具有挑战性。针对上述问题,我们提出以下三种解决方案: 1)重新设计完成子网。我们设计了一种新颖的完成子网络,它由多个多路径块(MPB)组成,用于聚合多尺度特征,并且不受有损下采样操作的影响 ...
点云处理技术的快速进步显着增加了对实现高精度分类的高效紧凑模型的需求。知识蒸馏已成为一种有效的模型压缩技术。然而,传统的KD通常需要大量的计算资源来对大型教师模型进行前向推理,从而降低了学生模型的训练效率并增加了资源需求 ...
点云表示学习的显着突破促进了它们在自动驾驶汽车和虚拟现实等现实世界应用中的使用。然而,这些应用通常迫切需要准确且高效的 3D 物体检测。最近,知识蒸馏被提出作为一种有效的模型压缩技术,它将知识从过度参数化的教师转移到轻量级的学生,并在 2D 视觉中实现一致的有效性 ...
在本文中,我们提出了一个简单而通用的自监督点云表示学习框架。人类通过提取两个层次的信息并建立它们之间的关系来理解3D世界。一是物体的整体形状,二是物体的局部结构 ...
C($^{3}$P) + O$_{2}$($^3\Sigma_{g}^{-}$) $\rightarrow$ CO($^{1}\Sigma) 的动态通过使用瞬态波包传播 (TDWP) 和准经典轨迹 (QCT) 模拟研究了 ^{+}$)+ O($^{1}$D) 在其电子基态上的反应。对于所考虑的中等碰撞能量($E_{\rm c} = 0.001$ 到 0. ...
大语言模型的预训练架构涵盖多种类型,包括自编码模型、自回归模型和编码器-解码器模型。我们假设任何模态都可以从大型语言模型中受益,只要它经过矢量量化成为离散标记。受 GLM 的启发,我们提出了一种通用点模型(GPM),它将自编码和自回归任务无缝集成在点云转换器中 ...
主流 3D 表示学习方法建立在对比或生成建模借口任务的基础上,在各种下游任务的性能方面已经取得了巨大的进步。然而,我们发现这两种范式具有不同的特征:(i)对比模型需要大量数据,并且存在表示过度拟合问题; (ii) 生成模型存在数据填充问题,与对比模型相比,数据扩展能力较差。这激励我们通过分享两种范式的优点来学习 3D 表示,由于两种范式之间的模式差异,这是很重要的 ...
学习 3D 表示在基于掩码自动编码器 (MAE) 的点云预训练方法中起着至关重要的作用,包括基于单模态和跨模态的 MAE。具体来说,虽然跨模态 MAE 方法通过其他模态知识的辅助学习强大的 3D 表示,但它们经常承受沉重的计算负担,并且严重依赖于通常不可用的大量跨模态数据对,这阻碍了它们在实践中的应用。相反,仅以点云作为输入的单模态方法由于其简单性和效率而在实际应用中受到青睐 ...