稀疏自动编码器最近生成了与大型语言模型表示的概念范围相对应的高维向量字典。我们发现这个概念宇宙在三个层面上具有有趣的结构:1)“原子”小尺度结构包含面为平行四边形或梯形的“晶体”,概括众所周知的例子,例如(男人-女人-国王-女王) 。我们发现,当投影出全局干扰方向(例如字长)时,这种平行四边形和相关函数向量的质量大大提高,这可以通过线性判别分析有效地完成 ...
元学习已被提议作为解决具有挑战性的小样本学习环境的框架。关键思想是利用大量类似的小样本任务来学习如何使基础学习器适应只有少数标记样本可用的新任务。由于深度神经网络(DNN)往往仅使用少量样本就容易过度拟合,因此元学习通常使用浅层神经网络(SNN),从而限制了其有效性 ...
我们提出了 MoGe,这是一种从单目开域图像中恢复 3D 几何的强大模型。给定单个图像,我们的模型使用仿射不变表示直接预测捕获场景的 3D 点图,这与真实的全局尺度和偏移无关。这种新的表示形式可以消除训练中的模糊监督,并促进有效的几何学习 ...
Segment Anything Model (SAM) 作为强大的视觉基础模型出现,可生成高质量的 2D 分割结果。本文旨在将 SAM 推广到分割 3D 对象。我们没有重复 3D 中昂贵的数据采集和注释过程,而是设计了一种高效的解决方案,利用辐射场作为廉价且现成的先验,将多视图 2D 图像连接到 3D 空间 ...
在这项工作中,我们介绍了 Unique3D,这是一种新颖的图像到 3D 框架,用于从单视图图像高效生成高质量的 3D 网格,具有最先进的生成保真度和强大的通用性。先前基于分数蒸馏采样 (SDS) 的方法可以通过从大型 2D 扩散模型中提取 3D 知识来产生多样化的 3D 结果,但它们通常会遇到个案优化时间较长且不一致的问题。最近的工作通过微调多视图扩散模型或训练快速前馈模型来解决该问题并生成更好的 3D 结果 ...
以对象为中心的机器人操作的设备本体学习是设备本体人工智能中快速发展且充满挑战的领域。它对于推进下一代智能机器人至关重要,并且最近引起了人们的极大兴趣。与数据驱动的机器学习方法不同,说明学习托盘通过与环境的物理和装载反馈来进行机器人学习,布置特别适合机器人操作... ...
嵌入式人工智能(Embodied AI)对于实现通用人工智能(AGI)至关重要,并且是连接网络空间和物理世界的各种应用的基础。最近,多模态大型模型(MLM)和世界模型(WM)的出现因其卓越的感知、交互和推理能力而引起了极大的关注,使它们成为具身智能体大脑的有前途的架构。然而,目前还没有针对传销时代的嵌入式人工智能的全面调查 ...
嵌入式人工智能(Embodied AI)对于实现通用人工智能(AGI)至关重要,并且是连接网络空间和物理世界的各种应用的基础。最近,多模态大型模型(MLM)和世界模型(WM)的出现因其卓越的感知、交互和推理能力而引起了极大的关注,使它们成为具身智能体大脑的有前途的架构。然而,目前还没有针对传销时代的嵌入式人工智能的全面调查 ...
我们引入了一种轻量级且准确的架构,以实现资源高效的视觉对应。我们的方法被称为 XFeat(加速特征),重新审视了卷积神经网络中用于检测、提取和匹配局部特征的基本设计选择。我们的新模型满足了对适合资源有限设备的快速且强大的算法的关键需求 ...
3D 分割是计算机视觉中的一个基本且具有挑战性的问题,在自动驾驶、机器人、增强现实和医学图像分析中都有应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统的 3D 分割方法基于手工制作的特征和机器学习分类器,缺乏泛化能力 ...