最近基于点的可区分渲染技术在高保真重建和快速渲染方面取得了重大成功。但是,由于基于点表示的非结构化性质,它们很难应用于为结构化网格设计的现代图形管道,以及与结构化网格表示配合良好的各种模拟和编辑算法。为此,我们提出了结构化的范围,这是一种新颖的表示,既可以实现重建对象的结构化几何表示,又可以实现对象的高保真渲染重建 ...
推理是大语言模型的基本能力。尽管先前的研究主要集中于增强数学或代码生成等狭窄技能,但由于稀疏和分散的培训数据,改善许多其他推理任务的绩效仍然具有挑战性。为了解决这个问题,我们提出了一种新颖的方法,该方法是通过将原始代码转换为代码输入输入输入输入预测格式,系统地凝结了本质上嵌入在上下文代码中的各种推理模式 ...
潜在扩散模型的最新进展证明了它们对高分辨率图像合成的有效性。但是,从 Token 剂中,潜在空间的特性以更好地学习和生成扩散模型的生成仍然不足。从理论和经验上讲,我们发现改善的发电质量与具有更好结构的潜在分布密切相关,例如具有更少的高斯混合物模式和更具歧视性特征的分布 ...
异质图神经网络(HGN)是在异质图上进行节点分类任务的突出方法。尽管表现出色,但关于HGN的预测的见解对人类来说是晦涩的。现有的解释性技术主要针对均匀图上的GNN提出 ...
解释图神经网络(XGNN)已越来越关注,以促进使用GNN的信任,这是学习图数据的主流方法。尽管他们越来越关注,但现有的XGNN专注于提高解释性能,并且在攻击下的鲁棒性在很大程度上尚未探索。我们注意到对手可以稍微扰动图形结构,从而在很大程度上改变了XGNN的解释结果 ...
从第一人称观点视频中了解人类行为会带来重大挑战。大多数先前的方法仅在以自我为中心的视频上探索表示形式学习,同时忽略了利用现有大型第三人称视频的潜在好处。在本文中,(1)我们开发了Egoinstructor,这是一种检索型多模式字幕模型,该模型会自动检索语义相关的第三人称教学视频,以增强以Egentric视频的视频字幕 ...
自我播放在两人和多玩家游戏中具有突破性的突破。在这里,我们表明自我播放是另一个领域中出奇的有效策略。我们表明,健壮和自然主义的驾驶完全来自以前所未有的规模的模拟中的自我玩法-1 ...
最近,高斯脱落成为代表3D场景的强大技术,实现了实时的栅格化和高保真渲染。然而,高斯固有的径向对称性和平滑度约束限制了它们表示复杂形状的能力,通常需要数千个原始素才能近似详细的几何形状。我们引入了可变形的径向内核(DRK),该核(DRK)扩展到更通用和灵活的框架中 ...