parsifalster的文档

parsifalster

个性签名 ...

Human Motion Diffusion as a Generative Prior

最近的工作证明了去噪扩散模型在生成人体运动方面的巨大潜力，包括文本到运动的能力。然而，这些方法受到缺乏带注释的运动数据、关注单人运动以及缺乏细节控制的限制。在本文中，我们介绍了基于扩散先验的三种组合形式：顺序组合、并行组合和模型组合 ...

0 0 0 0 2024/05/23 arXiv:2303.01418v3 parsifalster

The KIT Motion-Language Dataset

将人类运动和自然语言联系起来对于人类活动的语义表示的生成以及基于自然语言输入的机器人活动的生成非常有意义。然而，尽管该领域已经进行了多年的研究，但尚不存在标准化且公开可用的数据集来支持此类系统的开发和评估。因此，我们提出了 KIT 运动语言数据集，它是大型的、开放的且可扩展的 ...

0 0 0 0 2024/05/23 arXiv:1607.03827v2 parsifalster

SINC: Spatial Composition of 3D Human Motions for Simultaneous Action Generation

我们的目标是在给定描述同时动作的文本输入的情况下合成 3D 人体动作，例如在“行走”的同时“挥手”。我们将产生这种同时运动称为执行“空间构图”。与寻求从一个动作过渡到另一个动作的时间合成相反，空间合成需要了解哪个身体部位涉及哪个动作，以便能够同时移动它们 ...

0 0 0 0 2024/05/23 arXiv:2304.10417v3 parsifalster

MotionGPT: Finetuned LLMs Are General-Purpose Motion Generators

由于数字人类的不断出现的需求，从给定的动作描述生成真实的人体动作已经取得了显着的进步。虽然最近的工作在直接从文本动作描述生成运动方面取得了令人印象深刻的成果，但它们通常仅支持单一模式的控制信号，这限制了它们在真正的数字人类行业中的应用。本文提出了一种运动通用发生器（MotionGPT），它可以使用多模态控制信号，例如 ...

0 0 0 0 2025/06/01 arXiv:2306.10900v2 parsifalster

MotionCLIP: Exposing Human Motion Generation to CLIP Space

我们介绍了MotionCLIP，这是一种3D人体运动自动编码器，具有解缠结、行为且良好支持高度语义文本描述的潜在嵌入。MotionCLIP通过将其潜在空间与对比语言-图像预训练（CLIP）模型潜在的空间预想获得了其独特的功能。将人体运动流形与CLIP空间预想，隐式熔化CLIP将极其丰富的语义知识注入到流形中…… ...

0 0 0 0 2024/10/23 arXiv:2203.08063v1 parsifalster

ReMoDiffuse: Retrieval-Augmented Motion Diffusion Model

3D 人体动作生成对于创意产业至关重要。最近的进展依赖于具有领域知识的生成模型来生成文本驱动的动作，从而在捕获常见动作方面取得了实质性进展。然而，在更多样化的动议上的表现仍然不能令人满意 ...

0 0 0 0 2024/05/23 arXiv:2304.01116v1 parsifalster

TEACH: Temporal Action Composition for 3D Humans

给定一系列自然语言描述，我们的任务是生成与文本语义对应的 3D 人体动作，并遵循指令的时间顺序。特别是，我们的目标是实现一系列动作的合成，我们将其称为时间动作合成。文本条件运动合成的当前技术水平仅采用单个动作或单个句子作为输入 ...

0 0 0 0 2024/05/23 arXiv:2209.04066v2 parsifalster

MoFusion: A Framework for Denoising-Diffusion-based Motion Synthesis

人体运动合成的传统方法要么是确定性的，要么在运动多样性和运动质量之间进行权衡。针对这些限制，我们引入了MoFusion，即 ...

0 0 0 0 2024/05/23 arXiv:2212.04495v2 parsifalster

MotionDiffuse: Text-Driven Human Motion Generation with Diffusion Model

人体运动建模对于许多现代图形应用程序来说非常重要，这通常需要专业技能。为了消除外界人员的技能障碍，最近的动作生成方法可以直接生成自然以语言为条件的人体动作。但是，利用各种文本内部实现的多样化和细粒度的运动仍然具有挑战性... ...

0 0 0 0 2024/11/25 arXiv:2208.15001v1 parsifalster

TM2T: Stochastic and Tokenized Modeling for the Reciprocal Generation of 3D Human Motions and Texts

受视觉和语言这两种感知和交流方式之间紧密联系的思想，我们的论文旨在探索从文本生成3D人体运动，及其相互任务，分别是text2motion和motion2text的范畴。的挑战，特别是为了能够从相同的文本生成多个不同的运动，并避免产生不必要的无聊片段这样的姿势序列，我们建议使用运动 Token ，这是一种离散且结构紧凑的运动表示。当将运动和文本信号分别考虑为运动和文本标记时，这提供了一个公平的竞争环境...... ...

0 1 0 0 2024/12/16 arXiv:2207.01696v2 parsifalster