可以说,深度学习最成功的案例之一就是迁移学习。研究发现,在丰富的源集(例如 ImageNet)上预训练网络,一旦在通常较小的目标集上进行微调,就可以帮助提高性能,这对于语言和视觉领域的许多应用都有帮助 ...
图像域中视觉变换器 (ViT) 的对比学习 (CL) 已实现与传统卷积主干的 CL 相当的性能。然而,在使用 ViT 的 3D 点云预训练中,掩模自动编码器 (MAE) 建模仍然占主导地位。这就提出了一个问题:我们能否两全其美?为了回答这个问题,我们首先凭经验验证,将基于 MAE 的点云预训练与标准对比学习范式相结合,即使经过精心设计,也会导致性能下降 ...
在 3D 计算机视觉应用领域,点云小样本学习起着至关重要的作用。然而,由于数据的稀疏性、不规则性和无序性,它提出了艰巨的挑战。当前的方法依赖于复杂的局部几何提取技术,例如卷积、图和注意力机制,以及广泛的数据驱动的预训练任务 ...
目前的少镜头动作识别方法主要属于ProtoNet之后的度量学习框架,这说明了原型的重要性。尽管它们取得了相对较好的性能,但忽略了多模态信息的影响,例如 ...
为了更有效地泛化到未见过的域(类),大多数少样本分割(FSS)将直接利用预先训练的编码器,并且仅对解码器进行微调,特别是在当前大型模型的时代。然而,这种固定特征编码器往往与类无关,不可避免地激活与目标类无关的对象。相比之下,人类可以毫不费力地将注意力集中在视线中的特定物体上 ...
点云提供了灵活的几何表示,适用于计算机图形学中的无数应用;它们还包含大多数 3D 数据采集设备的原始输出。虽然点云上的手工设计特征早已在图形和视觉领域提出,然而,最近用于图像分析的卷积神经网络 (CNN) 取得的巨大成功表明了将 CNN 的洞察力应用到点云世界的价值。点云本质上缺乏拓扑信息,因此设计恢复拓扑的模型可以丰富点云的表示能力 ...
在本文中,我们提出了测试时训练,这是一种当训练和测试数据来自不同分布时提高预测模型性能的通用方法。我们将单个未标记的测试样本转变为自监督学习问题,在进行预测之前更新模型参数。这也自然地扩展到在线流中的数据 ...
少样本分类旨在学习分类器在训练过程中使用有限的标记示例识别看不见的类。虽然已经取得了重大进展,但网络设计、元学习算法日益复杂以及实现细节的差异使得公平比较变得困难。在本文中,我们提出了 1) 对几种代表性的少样本分类算法进行了一致的比较分析,结果表明更深的主干网显着减少了在具有有限域差异的数据集上的方法之间的性能差异,2) 一种改进的基线方法令人惊讶地实现了与 \miniI 和 CUB 数据集上的最新技术相比,具有竞争性能,3)用于评估少样本分类算法的跨域泛化能力的新实验设置 ...
现代领域适应方法在无需任何目标监督的情况下非常有效地对齐源域和目标域的特征分布。然而,我们表明,即使目标中存在一些标记示例,这些技术的性能也很差。为了解决这种半监督域适应(SSDA)设置,我们提出了一种新颖的最小最大熵(MME)方法,该方法可以对抗性地优化自适应少样本模型 ...
在受分布变化影响的目标域数据上部署模型需要进行调整。在无法访问完整源域数据并且需要对目标域进行即时推断的现实场景下,测试时训练 (TTT) 作为这种适应的解决方案而出现。尽管在 TTT 方面做出了很多努力,但实验设置仍存在混乱,从而导致不公平的比较 ...