处理点云数据是许多实际系统的重要组成部分。因此,已经提出了各种基于点的方法,并报告了随着时间的推移基准的稳定改进。我们研究了这一进展的关键要素,并发现了两个关键结果 ...
国家空间模型在自然语言处理(NLP)和最近的计算机视觉方面表现出了巨大的希望。本文介绍了一种利用Mamba和蒙版自动编码器网络的新方法,以在受监督和自我监督的学习中用于点云数据。我们提出了三个关键贡献,以增强曼巴在处理复杂点云结构中的能力 ...
在点云领域中自我监督学习的最新进展表现出了巨大的潜力。但是,这些方法通常会遇到缺点,包括冗长的预训练时间,在输入空间中重建的必要性或其他方式的必要性。为了解决这些问题,我们介绍了Point-jepa,这是专门为点云数据设计的联合嵌入预测架构 ...
几何深度学习的最新作品引入了神经网络,通过定义三角形网格的卷积(有时甚至汇总)操作,允许在三维几何数据上执行推理任务。但是,这些方法要么将输入网格视为图形,因此不利用网格的特定几何特性来进行特征聚集和下采样,或者专门用于网格,而是依靠对卷积的刚性定义,该卷积无法正确捕获网格的局部拓扑。我们提出了一种结合两种方法的优势的方法,同时解决了它们的局限性:我们将一个原始的偶型框架从图形神经网络文献绘制为三角形网格,并在两种类型的图形上定义了从输入网格构建的图形 ...
开放世界3D重建模型最近引起了极大的关注。但是,没有足够的3D归纳偏见,现有的方法通常需要昂贵的培训成本,并难以提取高质量的3D网格。在这项工作中,我们介绍了Meshformer,这是一种稀疏视图重建模型,该模型明确利用了3D本机结构,输入指导和培训监督 ...
网格是3D形状的重要且强大的数据类型,并且在计算机视觉和计算机图形领域进行了广泛研究。关于3D形状表示的任务,已经进行了广泛的研究工作,集中于如何使用体积网格,多视图和点云很好地表示3D形状。但是,由于网格数据的复杂性和不规则性,近年来使用网格数据几乎没有努力 ...
最近,自我监督的预训练在W.R.T.的各种任务上具有先进的视觉 Transformer ...
3D几何内容越来越流行。在本文中,我们研究了使用深神经网络分析变形3D网格的问题。变形的3D网格是灵活的,可以代表3D动画序列以及同一类别的对象集合,从而允许具有大规模非线性变形的各种形状 ...
现在,研究人员在使用深度学习处理2D图像方面取得了巨大的成功。近年来,3D计算机视觉和几何学深度学习引起了越来越多的关注。已经为不同的应用提出了许多针对3D形状的高级技术 ...
我们基于一个简单的扩散层对于空间通信非常有效的见解,引入了一种新的通用方法来对3D表面进行深度学习。所得的网络自动对表面的分辨率和采样的变化自动鲁棒,这是一种对实际应用至关重要的基本属性。我们的网络可以在各种几何表示(例如三角形网格或点云)上离散化,甚至可以在一个表示形式上训练,然后应用于另一种表示 ...