Roa的文档

Roa

个性签名 ...

Distillation with Contrast is All You Need for Self-Supervised Point Cloud Representation Learning

在本文中，我们提出了一个简单而通用的自监督点云表示学习框架。人类通过提取两个层次的信息并建立它们之间的关系来理解3D世界。一是物体的整体形状，二是物体的局部结构 ...

0 0 0 0 2025/01/18 arXiv:2202.04241v1 Roa

Quantum and Quasi-classical Dynamics of the C($^{3}$P) + O$_{2}$($^3Σ_{g}^{-}$) $\rightarrow$ CO($^{1}Σ^{+}$)+ O($^{1}$D) Reaction on Its Electronic Ground State

C($^{3}$P) + O$_{2}$($^3\Sigma_{g}^{-}$) $\rightarrow$ CO($^{1}\Sigma) 的动态通过使用瞬态波包传播 (TDWP) 和准经典轨迹 (QCT) 模拟研究了 ^{+}$)+ O($^{1}$D) 在其电子基态上的反应。对于所考虑的中等碰撞能量（$E_{\rm c} = 0.001$ 到 0. ...

0 0 0 0 2025/01/18 arXiv:2206.10958v1 Roa

General Point Model with Autoencoding and Autoregressive

大语言模型的预训练架构涵盖多种类型，包括自编码模型、自回归模型和编码器-解码器模型。我们假设任何模态都可以从大型语言模型中受益，只要它经过矢量量化成为离散标记。受 GLM 的启发，我们提出了一种通用点模型（GPM），它将自编码和自回归任务无缝集成在点云转换器中 ...

0 0 0 0 2025/01/14 arXiv:2310.16861v1 Roa

Contrast with Reconstruct: Contrastive 3D Representation Learning Guided by Generative Pretraining

主流 3D 表示学习方法建立在对比或生成建模借口任务的基础上，在各种下游任务的性能方面已经取得了巨大的进步。然而，我们发现这两种范式具有不同的特征：（i）对比模型需要大量数据，并且存在表示过度拟合问题； (ii) 生成模型存在数据填充问题，与对比模型相比，数据扩展能力较差。这激励我们通过分享两种范式的优点来学习 3D 表示，由于两种范式之间的模式差异，这是很重要的 ...

0 0 0 0 2025/01/14 arXiv:2302.02318v2 Roa

Towards Compact 3D Representations via Point Feature Enhancement Masked Autoencoders

学习 3D 表示在基于掩码自动编码器 (MAE) 的点云预训练方法中起着至关重要的作用，包括基于单模态和跨模态的 MAE。具体来说，虽然跨模态 MAE 方法通过其他模态知识的辅助学习强大的 3D 表示，但它们经常承受沉重的计算负担，并且严重依赖于通常不可用的大量跨模态数据对，这阻碍了它们在实践中的应用。相反，仅以点云作为输入的单模态方法由于其简单性和效率而在实际应用中受到青睐 ...

0 0 0 0 2025/01/12 arXiv:2312.10726v1 Roa

Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud Pre-training

掩码自动编码器 (MAE) 在语言和 2D 图像转换器的自监督预训练方面显示出了巨大的潜力。然而，如何利用屏蔽自动编码来学习不规则点云的 3D 表示仍然是一个悬而未决的问题。在本文中，我们提出了 Point-M2AE，这是一种强大的多尺度 MAE 预训练框架，用于 3D 点云的分层自监督学习 ...

0 0 0 0 2025/01/12 arXiv:2205.14401v2 Roa

No Time to Train: Empowering Non-Parametric Networks for Few-shot 3D Scene Segmentation

为了减少对大规模数据集的依赖，最近的 3D 分割工作采用了小样本学习。当前的 3D 少镜头分割方法首先在“已见”类上预训练模型，然后评估其在“未见”类上的泛化性能。然而，先前的预训练阶段不仅引入了过多的时间开销，而且还在“看不见的”类上产生了显着的域差距 ...

0 0 0 0 2025/01/03 arXiv:2404.04050v1 Roa

PointSIFT: A SIFT-like Network Module for 3D Point Cloud Semantic Segmentation

最近，3D理解研究揭示了直接从点云中提取特征的方法，这需要对点云进行有效的形状模式描述。受到杰出的 2D 形状描述符 SIFT 的启发，我们设计了一个名为 PointSIFT 的模块，它对不同方向的信息进行编码并自适应形状的比例。具体来说，设计一个方向编码单元来描述八个关键方向，并通过堆叠多个方向编码单元来实现多尺度表示 ...

0 0 0 0 2025/01/03 arXiv:1807.00652v2 Roa

Efficient Feature Aggregation and Scale-Aware Regression for Monocular 3D Object Detection

单目 3D 物体检测由于简单且成本低廉而引起了极大的关注。现有方法通常遵循传统的 2D 检测范例，首先定位对象中心，然后通过相邻特征预测 3D 属性。然而，这些方法主要依赖于渐进的跨尺度特征聚合，并且仅关注局部信息，这可能导致缺乏全局意识和遗漏小尺度物体 ...

0 0 0 0 2024/12/24 arXiv:2411.02747v1 Roa

LSSInst: Improving Geometric Modeling in LSS-Based BEV Perception with Instance Representation

随着自动驾驶中仅使用摄像头的 3D 物体检测受到关注，基于鸟瞰图 (BEV) 表示的方法（特别是源自前视变换范式，即 lift-splat-shoot (LSS)）最近出现了重大进展 ...

0 0 0 0 2024/12/24 arXiv:2411.06173v2 Roa