在本文中,我们对 3D 可变形面部模型自首次提出以来的 20 年进行了详细调查。构建和应用这些模型的挑战,即捕获、建模、图像形成和图像分析,仍然是活跃的研究主题,我们回顾了每个领域的最新技术。我们还展望未来,确定未解决的挑战,提出未来研究的方向,并强调当前和未来的广泛应用 ...

0 0 0 0 2024/09/28 arXiv:1909.01815v2 parsifalster

最近的工作一直在探索嵌入式人工智能领域的缩放定律。考虑到收集现实世界数据的成本高昂,我们相信模拟到真实 (Sim2Real) 范式是扩展具体模型学习的关键一步。本文介绍了 GRUtopia 项目,这是第一个为各种机器人设计的模拟交互式 3D 社会 ...

0 0 0 0 2024/09/24 arXiv:2407.10943v1 parsifalster

如果机器人要与人类一起有效地工作,它们必须能够解释 3D 环境中对象的自然语言引用。理解 3D 引用表达式具有挑战性 - 它需要能够解析场景的 3D 结构,并在存在干扰和混乱的情况下正确地理解自由形式语言。我们引入了 Transcrib3D,这是一种将 3D 检测方法和大型语言模型 (LLM) 的紧急推理功能结合在一起的方法 ...

0 0 0 0 2024/09/24 arXiv:2404.19221v1 parsifalster

正摆和倒立摆仍然是科学中主要的物理模型和隐喻之一。倒立摆也是控制理论中的经典研究案例。在本文中,我们考虑通过弹簧控制的倒立摆的特殊演示版本 ...

0 0 0 0 2024/09/22 arXiv:physics/0512122v1 parsifalster

本文提供了实施两种重要的策略梯度方法来解决倒立摆问题的细节。它们是深度确定性策略梯度(DDPG)和近端策略优化(PPO)算法。该问题通过使用行动者-批评者模型来解决,其中行动者网络用于学习策略函数,批评者网络通过学习估计 Q 函数来评估行动者网络 ...

0 0 0 0 2024/09/22 arXiv:2105.07998v1 parsifalster

大量动画研究侧重于运动控制的优化,无论是作为动作序列还是策略参数。然而,由于目标函数的封闭式表达式通常不可用,我们对优化问题的理解是有限的。基于最近分析神经网络训练的工作,我们贡献了高维控制优化景观的新颖可视化;这让我们深入了解为什么控制优化很困难,以及为什么提前终止和基于样条的动作参数化等常见做法使优化变得更容易 ...

0 0 0 0 2024/09/22 arXiv:1909.07869v3 parsifalster

学习灵巧的操作技能是计算机图形学和机器人技术中长期存在的挑战,特别是当任务涉及手、工具和物体之间复杂而微妙的交互时。在本文中,我们重点关注基于筷子的对象重定位任务,这些任务很常见但要求很高。成功的筷子技巧的关键是稳定地握住筷子,这也支持微妙的动作 ...

0 0 0 0 2024/09/22 arXiv:2205.14313v3 parsifalster

通过从扩散模型中提取知识,文本引导的 3D 头像生成方面的最新进展取得了实质性进展。尽管生成的外观看似合理,但现有方法无法实现内部身体和服装之间的细粒度分离或高保真建模。在本文中,我们提出了芭比娃娃,这是一种用于生成 3D 头像的新颖框架,可以穿着各种高质量的芭比娃娃服装和配饰 ...

0 0 0 0 2024/09/17 arXiv:2408.09126v3 parsifalster

视频中的运动主要包括由摄像机运动引起的摄像机运动和由对象运动引起的对象运动。准确控制摄像机和物体运动对于视频生成至关重要。然而,现有的工作要么主要关注一种运动类型,要么没有明确区分两者,限制了它们的控制能力和多样性 ...

0 0 0 0 2024/09/17 arXiv:2312.03641v2 parsifalster

我们提出了 SelfRecon,一种穿着衣服的人体重建方法,它结合了隐式和显式表示,从单眼自旋转人体视频中恢复时空相干的几何形状。显式方法需要针对给定序列预定义模板网格,而针对特定主题很难获取模板。同时,固定的拓扑限制了重建精度和服装类型 ...

0 0 0 0 2024/09/17 arXiv:2201.12792v2 parsifalster

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)