Roa的文档

Roa

个性签名 ...

Edge-Aware Mirror Network for Camouflaged Object Detection

现有的边缘感知伪装目标检测（COD）方法通常在早期输出边缘预测。然而，边缘是后续分割任务中重要且基本的因素。由于伪装目标与周围环境之间的高度视觉相似性，早期边缘先验预测通常会引入错误的前景-背景并污染分割特征 ...

0 0 0 0 2025/01/25 arXiv:2307.03932v1 Roa

3D Feature Prediction for Masked-AutoEncoder-Based Point Cloud Pretraining

由于掩码自动编码器 (MAE) 在 NLP 和计算机视觉方面取得的巨大成功，最近被引入点云的 3D 自监督预训练中。与图像域中使用的 MAE 不同，MAE 的借口任务是恢复被屏蔽像素处的特征（例如颜色），而现有的 3D MAE 仅重建缺失的几何图形，即被屏蔽点的位置 ...

0 0 0 0 2025/01/23 arXiv:2304.06911v2 Roa

Regress Before Construct: Regress Autoencoder for Point Cloud Self-supervised Learning

掩码自动编码器 (MAE) 在 2D 和 3D 计算机视觉的自监督学习中表现出了良好的性能。然而，现有的基于 MAE 的方法仍然存在一定的缺陷。首先，编码器和解码器之间的功能解耦不完整，这限制了编码器的表示学习能力 ...

0 0 0 0 2025/01/23 arXiv:2310.03670v1 Roa

PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning

Transformer 彻底改变了点云学习任务，但二次复杂度阻碍了其向长序列的扩展，并给有限的计算资源带来了负担。最近出现的 RWKV（一种新的深度序列模型）在 NLP 任务中的序列建模方面显示出了巨大的潜力。在本文中，我们提出了 PointRWKV，这是一种线性复杂度模型，源自 NLP 领域的 RWKV 模型，并针对点云学习任务进行了必要的修改 ...

0 0 0 0 2025/01/23 arXiv:2405.15214v2 Roa

Window Normalization: Enhancing Point Cloud Understanding by Unifying Inconsistent Point Densities

下采样和特征提取是 3D 点云理解的基本过程。现有方法受到点云中不同部分点密度不一致的限制。在这项工作中，我们分析了下采样阶段的局限性，并提出了预抽象分组窗口归一化模块 ...

0 0 0 0 2025/01/23 arXiv:2212.02287v1 Roa

AO-DETR: Anti-Overlapping DETR for X-Ray Prohibited Items Detection

X射线图像中的违禁物品检测是广泛应用于各种安检场景中最重要、最有效的方法之一。考虑到 X 射线禁止物品图像中明显的重叠现象，我们提出了一种基于最先进的通用物体检测器 DINO 的防重叠 DETR（AO-DETR）。具体来说，为了解决重叠现象引起的特征耦合问题，我们引入了特定类别一对一分配（CSA）策略来约束特定类别对象查询在预测固定类别的禁止项目时，这可以增强它们的能力从重叠的前景-背景特征中提取特定类别的违禁物品的特征 ...

0 0 0 0 2025/01/22 arXiv:2403.04309v1 Roa

CM-UNet: Hybrid CNN-Mamba UNet for Remote Sensing Image Semantic Segmentation

由于大规模图像尺寸和对象变化，当前基于 CNN 和 Transformer 的遥感图像语义分割方法对于捕获远程依赖性不是最佳的，或者受限于复杂的计算复杂性。在本文中，我们提出了 CM-UNet，包括用于提取局部图像特征的基于 CNN 的编码器和用于聚合和集成全局信息的基于 Mamba 的解码器，促进遥感图像的高效语义分割。具体来说，引入 CSMamba 块来构建核心分割解码器，该解码器采用通道和空间注意力作为 vanilla Mamba 的门激活条件，以增强特征交互和全局局部信息融合 ...

0 1 0 0 2025/01/20 arXiv:2405.10530v1 Roa

SCPNet: Semantic Scene Completion on Point Cloud

由于输入稀疏且不完整、大量不同尺度的对象以及移动对象固有的标签噪声，训练语义场景完成（SSC）深度模型具有挑战性。针对上述问题，我们提出以下三种解决方案： 1）重新设计完成子网。我们设计了一种新颖的完成子网络，它由多个多路径块（MPB）组成，用于聚合多尺度特征，并且不受有损下采样操作的影响 ...

0 0 0 0 2025/01/19 arXiv:2303.06884v1 Roa

Efficient Point Cloud Classification via Offline Distillation Framework and Negative-Weight Self-Distillation Technique

点云处理技术的快速进步显着增加了对实现高精度分类的高效紧凑模型的需求。知识蒸馏已成为一种有效的模型压缩技术。然而，传统的KD通常需要大量的计算资源来对大型教师模型进行前向推理，从而降低了学生模型的训练效率并增加了资源需求 ...

0 0 0 0 2025/01/18 arXiv:2409.02020v2 Roa

PointDistiller: Structured Knowledge Distillation Towards Efficient and Compact 3D Detection

点云表示学习的显着突破促进了它们在自动驾驶汽车和虚拟现实等现实世界应用中的使用。然而，这些应用通常迫切需要准确且高效的 3D 物体检测。最近，知识蒸馏被提出作为一种有效的模型压缩技术，它将知识从过度参数化的教师转移到轻量级的学生，并在 2D 视觉中实现一致的有效性 ...

0 0 0 0 2025/01/18 arXiv:2205.11098v1 Roa