对多样化的互联网规模数据进行训练是近期大型基础模型成功的关键因素。然而,使用相同的方法来构建实体代理却面临着明显的困难。尽管有许多众包的体现数据集,但由于不同机器人的不同物理体现和控制接口,它们的动作空间通常表现出显着的异质性,这给使用跨域数据开发体现基础模型带来了巨大的挑战 ...
图3D数据(例如点云或原子)建模的图形神经网络通常希望为$ SO(3)$ ecorianiant,即等效于3D旋转 ...
具有功能化尖端顶点的扫描隧道显微镜(STM)揭示了同一实验中样品的几何和电子结构。但是,信号的复杂性质使图像难以解释,迄今为止,大多数研究都对具有已知化学成分的平面样品有限。在这里,我们通过构建成功在非接触原子力显微镜(NC-AFM)中的成功方法来构建成功的方法,介绍了STM(ASD-STM)的自动结构发现,该工具是一种机器学习工具,该工具可直接从STM图像预测原子结构 ...
本文解决了图机学习中分布外(OOD)概括的挑战,该领域迅速前进但与源和目标数据分布之间的差异进行了努力。传统的图形学习算法,基于训练和测试数据之间均匀分布的假设,在这种假设失败的现实情况下,步履蹒跚,导致次优性能。促成这种次优性能的主要因素是通过随机梯度下降(SGD)训练的神经网络的固有简单偏置,该偏见比更复杂但更相同或更具预测性的更简单特征更喜欢更简单的特征 ...
节点嵌入旨在将复杂图中的节点映射到低维表示中。实际的大规模图和标记的困难激发了无监督节点嵌入问题的广泛研究。但是,以前的工作主要在给出完整图的集中设置中运行 ...
Wanda和Ria等流行的训练后修剪方法以其简单而有效的设计而闻名,这些设计表现出了出色的经验表现。万达通过修剪过程中的校准激活来优化性能,而RIA则强调了体重元素的相对而不是绝对的重要性。尽管他们的实践成功,但缺乏解释这些结果的彻底理论基础 ...
通过将外部知识纳入大型语言模型(LLMS),取回索引的索引 - 回程生成范式(RAG)在解决知识密集型任务方面非常成功。但是,外部和未经验证的知识的合并会增加LLM的脆弱性,因为攻击者可以通过操纵知识来执行攻击任务。在本文中,我们引入了一个名为Saferag的基准,旨在评估抹布安全性 ...
大型基础模型彻底改变了该领域,但在优化专门视觉任务的多模式模型方面仍然存在挑战。我们提出了一种新颖的,可推广的方法,以通过测量各种输入提示的输出一致性来识别黑框视觉模型(VLM)的首选图像分布。将其应用于不同类型的3D对象的不同类型,我们演示了其在各个领域的功效,需要精确解释复杂的结构,重点是计算机辅助设计(CAD)作为示例场 ...