3D 对象重建方面的最新进展非常显着,但当前大多数 3D 模型严重依赖现有 3D 数据集。多样化 3D 数据集的稀缺导致 3D 重建模型的泛化能力有限。在本文中,我们提出了一种新颖的框架,通过生成伪 GT 数据来促进多视图细化 (MVBoost) 的 3D 重建 ...
预训练语言模型 (PLM) 在解决各种通用自然语言处理 (NLP) 任务方面表现出了出色的能力。研究人员观察到这些模型的性能与其规模之间存在直接相关性。因此,近年来这些模型的规模显着扩大,促使研究人员采用大型语言模型 (LLM) 一词来描述较大规模的 PLM ...
当前基于模型的强化学习(MBRL)代理正在努力应对长期依赖性。这限制了他们有效解决涉及行动和结果之间较长时间间隔的任务的能力,或者需要回忆遥远的观察结果以告知当前行动的任务。为了提高时间一致性,我们在 MBRL 智能体的世界模型中集成了一系列新的状态空间模型 (SSM),以提出一种新方法,Recall to Imagine (R2I) ...
我们在电路复杂性的背景下研究基于模型和无模型强化学习(RL)的表示复杂性。我们从理论上证明,存在一类广泛的 MDP,其底层转换和奖励函数可以用多项式大小的恒定深度电路来表示,而最优 $Q$ 函数在恒定深度电路中会遇到指数电路复杂性。通过关注近似误差并建立与复杂性理论的联系,我们的理论从新颖的表示复杂性角度提供了独特的见解,解释了为什么基于模型的算法通常比无模型算法具有更好的样本复杂性:在某些情况下 ...
发生在动态图(即事件流)上的兴奋点过程(即事件流) ...
为了减少深度 Transformer 网络中可训练参数的数量,我们采用强化学习在训练期间动态选择层并将它们连接在一起。每隔几次迭代,RL 代理就会被询问是否独立训练每一层 $i$,还是复制前一层 $j<i$ 的权重。这有利于权重共享,减少可训练参数的数量,并且还可以作为一种有效的正则化技术 ...
交互式环境中动力学的准确建模对于成功的远程预测至关重要。这种能力可以推进强化学习(RL)和规划算法,但实现它具有挑战性。模型估计的不准确性可能会加剧,导致长期误差增加 ...
最近,神经网络已被广泛用于求解物理系统建模中的偏微分方程(PDE)。虽然主要研究集中在预定义静态网格离散化上的学习系统演化,但由于这些系统的动态性质,一些方法利用强化学习或监督学习技术来创建自适应和动态网格。然而,这些方法面临两个主要挑战:(1)需要昂贵的最优网格数据,(2)网格细化过程中解空间自由度和拓扑的变化 ...