在过去的几十年里,人体姿势估计(HPE)引起了计算机视觉界的广泛关注。此外,HPE已应用于各个领域,例如人机交互、运动分析以及通过图像和视频进行的人体跟踪。最近,基于深度学习的方法在基于 HPE 的应用中展现出了最先进的性能 ...

0 0 0 0 2024/05/29 arXiv:2308.13872v1 parsifalster

3D 人体姿态估计和网格恢复吸引了计算机视觉、自动驾驶和机器人等许多领域的广泛研究兴趣。 3D 人体姿势估计和网格恢复的深度学习最近蓬勃发展,提出了许多方法来解决该领域的不同问题。在本文中,为了激发未来的研究,我们通过深入研究 200 多篇参考文献,全面回顾了过去五年该领域深度学习方法的最新进展 ...

0 0 0 0 2024/05/29 arXiv:2402.18844v1 parsifalster

以自我为中心的人体姿势估计旨在从第一人称相机角度估计人体姿势并开发身体表示。近年来,由于其在 XR 技术、人机交互和健身追踪等领域的广泛应用,它受到了广泛的欢迎。然而,据我们所知,还没有基于所提出的有关以自我为中心的 3D 人体姿态估计解决方案的系统文献综述 ...

0 0 0 0 2024/05/29 arXiv:2403.17893v2 parsifalster

使用扩散和自回归模型的文本到运动生成的最新进展已经显示出有希望的结果。然而,这些模型通常需要在实时性能、高保真度和运动可编辑性之间进行权衡。为了解决这一差距,我们引入了 MMM,这是一种基于蒙蔽运动模型的新颖而简单的运动生成范例 ...

0 1 0 0 2024/05/23 arXiv:2312.03596v2 parsifalster

在本文中,我们提出了 Motion-X,一个大规模 3D 表达全身运动数据集。现有的运动数据集主要包含仅身体姿势,缺乏面部表情、手势和细粒度的姿势描述。此外,它们主要是从有限的实验室场景中收集的,并手动标记文本描述,这极大地限制了它们的可扩展性 ...

0 0 0 0 2024/05/23 arXiv:2307.00818v2 parsifalster

最近,我们在产生逼真的人体运动的扩散方面取得了巨大进展。然而,他们在很大程度上忽视了多人互动。在本文中,我们提出了 InterGen,这是一种有效的基于扩散的方法,它将人与人的交互融入到运动扩散过程中,使外行用户能够在仅文本指导的情况下定制高质量的两人交互运动 ...

0 0 0 0 2024/05/23 arXiv:2304.05684v3 parsifalster

在本文中,我们提出了 TMR,一种简单而有效的文本到 3D 人体运动检索方法。虽然之前的工作仅将检索视为代理评估指标,但我们将其作为独立任务来处理。我们的方法扩展了最先进的文本到运动合成模型 TEMOS,并结合了对比损失以更好地构建跨模态潜在空间 ...

0 0 0 0 2024/05/23 arXiv:2305.00976v2 parsifalster

计算机视觉中文本驱动的人体运动生成既重要又具有挑战性。然而,当前的方法仅限于产生确定性或不精确的运动序列,无法有效地控制符合给定文本描述所需的时间和空间关系。在这项工作中,我们提出了一种细粒度的方法,用于生成支持精确文本描述的高质量、有条件的人体运动序列 ...

0 0 0 0 2024/05/23 arXiv:2309.06284v1 parsifalster

文本到动作的生成是一项艰巨的任务,旨在产生与输入文本一致的人体动作,同时遵守人类的能力和物理定律。尽管扩散模型取得了进步,但它们在离散空间中的应用仍未得到充分探索。当前的方法常常忽视不同运动的不同重要性,而对它们进行统一处理 ...

0 0 0 0 2024/05/23 arXiv:2308.14480v2 parsifalster

动作识别是一项相对成熟的任务,其中给定人体运动的输入序列,目标是预测其动作类别。另一方面,本文考虑了一个相对较新的问题,可以将其视为动作识别的逆过程:给定指定的动作类型,我们的目标是在 3D 中生成合理的人体运动序列。重要的是,生成的运动集有望保持其多样性,以便能够探索整个动作条件运动空间;同时,每个采样序列都忠实地类似于自然的人体关节动态 ...

0 0 1 1 2024/05/23 arXiv:2007.15240v1 parsifalster

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)