bnexx的文档

bnexx

个性签名 ...

Hallo: Hierarchical Audio-Driven Visual Synthesis for Portrait Image Animation

在语音音频输入的驱动下，肖像动画领域在生成生动和动态的肖像方面取得了重大进展。这项研究深入研究了同步化运动以及基于扩散的方法框架内的图像视觉打造上吸引人、时间一致动画的复目光精度，包括眉毛、表情和动作姿势... ...

0 0 0 0 2024/12/30 arXiv:2406.08801v2 bnexx

EMOCA: Emotion Driven Monocular Face Capture and Animation

随着3d面部头像越来越广泛地用于交流，它们忠实地传达情感至关重要。不幸的是，从单眼图像回归参数化，3d面部模型的最新最佳方法无法捕捉完整的面部表情，例如微妙，例如微妙（（）不足以捕获高保真表情... ...

0 0 0 0 2025/02/13 arXiv:2204.11312v1 bnexx

Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos

由于深度学习的出现，基于图像数据的单目 3D 人脸重建的最新技术取得了一些令人印象深刻的进步。然而，它主要关注来自单个 RGB 图像的输入，忽略了以下重要因素： a) 如今，绝大多数感兴趣的面部图像数据并非源自单个图像，而是来自视频，其中包含丰富的动态信息。 b) 此外，这些视频通常以某种形式的口头交流（公开演讲、电话会议、视听人机交互、采访、电影中的独白/对话等）捕捉个人 ...

0 0 0 0 2024/06/19 arXiv:2207.11094v1 bnexx

Accurate 3D Face Reconstruction with Weakly-Supervised Learning: From Single Image to Image Set

最近，基于深度学习的 3D 人脸重建方法在质量和效率上都显示出了可喜的结果。然而，深度神经网络的训练通常需要大量数据，而具有真实 3D 人脸形状的人脸图像却很少。在本文中，我们提出了一种新颖的深度 3D 人脸重建方法，该方法1）利用鲁棒的混合损失函数进行弱监督学习，同时考虑低级和采集级信息进行监督，2）通过利用不同图像的互补信息进行形状聚合来重建人脸执行按钮处理... ...

0 0 0 0 2024/12/04 arXiv:1903.08527v2 bnexx

PIRenderer: Controllable Portrait Image Generation via Semantic Neural Rendering

通过控制现有面部的运动来生成肖像图像是对社交媒体行业具有重大影响的一项重要任务。为了易于使用和直观控制，应使用语义上有意义且完全解开的参数作为修改。然而，许多现有技术不提供这种细粒度的控制或使用间接编辑方法i ...

0 0 0 0 2024/06/18 arXiv:2109.08379v1 bnexx

High-Fidelity 3D Digital Human Head Creation from RGB-D Selfies

我们展示了一个全自动系统，可以使用消费级 RGB-D 自拍相机生产高保真、逼真的 3D 数字人头。该系统只需要用户在旋转头部的同时拍摄一段简短的RGB-D自拍视频，就能在不到30秒的时间内产生高质量的头部重建。我们的主要贡献是一种新的面部几何建模和反射合成程序，显着提高了最先进的水平 ...

0 0 0 0 2024/05/31 arXiv:2010.05562v2 bnexx

MetaPortrait: Identity-Preserving Talking Head Generation with Fast Personalized Adaptation

在这项工作中，我们提出了一个保留ID的头部说话生成框架，该框架在两个方面改进了以前的方法。首先，与稀疏流中插值相反，指定密集的地标以实现准确其次，受人脸交换方法的启发，我们在合成过程中自适应地融合源恒等式，使网络更好地保留图像肖像的关键特征... ...

0 0 0 0 2024/10/16 arXiv:2212.08062v3 bnexx

DPE: Disentanglement of Pose and Expression for General Video Portrait Editing

一次性视频驱动的说话脸部生成旨在通过将面部运动从视频转移到任意肖像图像来生成合成说话视频。头部姿势和面部表情总是与面部运动纠缠在一起并同时转移。然而，这种纠缠为这些方法直接用于视频人像编辑设置了障碍，可能需要在保持姿势不变的情况下仅修改表情 ...

0 0 0 0 2024/05/11 arXiv:2301.06281v2 bnexx

EDTalk: Efficient Disentanglement for Emotional Talking Head Synthesis

实现对多种面部动作的分离控制并适应不同的输入方式极大地增强了头部说话一代的应用和娱乐性。这就需要深入探索面部特征的解耦空间，确保它们a）独立运行而不会相互干扰，b）可以保留以与不同的模态输入共享，这两方面在现有方法中经常被忽视。为了解决这一差距，本文提出了一种新颖的对话头生成高效解缠框架（EDTalk） ...

0 0 0 0 2024/05/09 arXiv:2404.01647v1 bnexx

Projected GANs Converge Faster

生成对抗网络 (GAN) 可以生成高质量的图像，但训练起来却很困难。它们需要仔细的正则化、大量的计算和昂贵的超参数扫描。通过将生成的样本和真实的样本投影到固定的预训练特征空间中，我们在这些问题上取得了重大进展 ...

0 0 0 0 2024/05/09 arXiv:2111.01007v1 bnexx