parsifalster的文档

parsifalster

个性签名 ...

Vision-Based Human Pose Estimation via Deep Learning: A Survey

在过去的几十年里，人体姿势估计（HPE）引起了计算机视觉界的广泛关注。此外，HPE已应用于各个领域，例如人机交互、运动分析以及通过图像和视频进行的人体跟踪。最近，基于深度学习的方法在基于 HPE 的应用中展现出了最先进的性能 ...

0 0 0 0 2024/05/29 arXiv:2308.13872v1 parsifalster

Deep Learning for 3D Human Pose Estimation and Mesh Recovery: A Survey

3D 人体姿态估计和网格恢复吸引了计算机视觉、自动驾驶和机器人等许多领域的广泛研究兴趣。 3D 人体姿势估计和网格恢复的深度学习最近蓬勃发展，提出了许多方法来解决该领域的不同问题。在本文中，为了激发未来的研究，我们通过深入研究 200 多篇参考文献，全面回顾了过去五年该领域深度学习方法的最新进展 ...

0 0 0 0 2024/05/29 arXiv:2402.18844v1 parsifalster

A Survey on 3D Egocentric Human Pose Estimation

以自我为中心的人体姿势估计旨在从第一人称相机角度估计人体姿势并开发身体表示。近年来，由于其在 XR 技术、人机交互和健身追踪等领域的广泛应用，它受到了广泛的欢迎。然而，据我们所知，还没有基于所提出的有关以自我为中心的 3D 人体姿态估计解决方案的系统文献综述 ...

0 0 0 0 2024/05/29 arXiv:2403.17893v2 parsifalster

MMM: Generative Masked Motion Model

使用扩散和自回归模型的文本到运动生成的最新进展已经显示出有希望的结果。然而，这些模型通常需要在实时性能、高保真度和运动可编辑性之间进行权衡。为了解决这一差距，我们引入了 MMM，这是一种基于蒙蔽运动模型的新颖而简单的运动生成范例 ...

0 1 0 0 2024/05/23 arXiv:2312.03596v2 parsifalster

Motion-X: A Large-scale 3D Expressive Whole-body Human Motion Dataset

在本文中，我们提出了 Motion-X，一个大规模 3D 表达全身运动数据集。现有的运动数据集主要包含仅身体姿势，缺乏面部表情、手势和细粒度的姿势描述。此外，它们主要是从有限的实验室场景中收集的，并手动标记文本描述，这极大地限制了它们的可扩展性 ...

0 0 0 0 2024/05/23 arXiv:2307.00818v2 parsifalster

InterGen: Diffusion-based Multi-human Motion Generation under Complex Interactions

最近，我们在产生逼真的人体运动的扩散方面取得了巨大进展。然而，他们在很大程度上忽视了多人互动。在本文中，我们提出了 InterGen，这是一种有效的基于扩散的方法，它将人与人的交互融入到运动扩散过程中，使外行用户能够在仅文本指导的情况下定制高质量的两人交互运动 ...

0 0 0 0 2024/05/23 arXiv:2304.05684v3 parsifalster

TMR: Text-to-Motion Retrieval Using Contrastive 3D Human Motion Synthesis

在本文中，我们提出了 TMR，一种简单而有效的文本到 3D 人体运动检索方法。虽然之前的工作仅将检索视为代理评估指标，但我们将其作为独立任务来处理。我们的方法扩展了最先进的文本到运动合成模型 TEMOS，并结合了对比损失以更好地构建跨模态潜在空间 ...

0 0 0 0 2024/05/23 arXiv:2305.00976v2 parsifalster

Fg-T2M: Fine-Grained Text-Driven Human Motion Generation via Diffusion Model

计算机视觉中文本驱动的人体运动生成既重要又具有挑战性。然而，当前的方法仅限于产生确定性或不精确的运动序列，无法有效地控制符合给定文本描述所需的时间和空间关系。在这项工作中，我们提出了一种细粒度的方法，用于生成支持精确文本描述的高质量、有条件的人体运动序列 ...

0 0 0 0 2024/05/23 arXiv:2309.06284v1 parsifalster

Priority-Centric Human Motion Generation in Discrete Latent Space

文本到动作的生成是一项艰巨的任务，旨在产生与输入文本一致的人体动作，同时遵守人类的能力和物理定律。尽管扩散模型取得了进步，但它们在离散空间中的应用仍未得到充分探索。当前的方法常常忽视不同运动的不同重要性，而对它们进行统一处理 ...

0 0 0 0 2024/05/23 arXiv:2308.14480v2 parsifalster

Action2Motion: Conditioned Generation of 3D Human Motions

动作识别是一项相对成熟的任务，其中给定人体运动的输入序列，目标是预测其动作类别。另一方面，本文考虑了一个相对较新的问题，可以将其视为动作识别的逆过程：给定指定的动作类型，我们的目标是在 3D 中生成合理的人体运动序列。重要的是，生成的运动集有望保持其多样性，以便能够探索整个动作条件运动空间；同时，每个采样序列都忠实地类似于自然的人体关节动态 ...

0 0 1 1 2024/05/23 arXiv:2007.15240v1 parsifalster