bnexx的文档

bnexx

个性签名 ...

EMOPortraits: Emotion-enhanced Multimodal One-shot Head Avatars

通过视觉信号动画化的头部头像已经很受欢迎，特别是在所有权与动画角色不同的该交叉操作合成中，这是一种具有挑战性但非常实用的方法。最近推出的 MegaPortraits 模型展示了我们对该模型进行了深入的审视和评估，特别关注其面部表情动作的潜在空间，并揭示了其表达强烈面部运动能力的一些制约... ...

0 0 0 0 2024/11/28 arXiv:2404.19110v1 bnexx

Progressive Disentangled Representation Learning for Fine-Grained Controllable Talking Head Synthesis

我们提出了一种新颖的一次性头部说话合成方法，可以实现对嘴唇运动、眼睛注视和眨眼、头部姿势和情绪表达的解开和细粒度控制。我们通过解开的潜在表示来表示不同的运动，并利用图像生成器从它们中合成会说话的头像。为了有效地解开每个运动因素，我们通过以从粗到细的方式分离因素，提出了一种渐进式解开表示学习策略，其中我们首先从驱动信号中提取统一的运动特征，然后将每个细粒度的运动从驱动信号中分离出来。统一的功能 ...

0 0 0 0 2024/05/09 arXiv:2211.14506v1 bnexx

DisCoHead: Audio-and-Video-Driven Talking Head Generation by Disentangled Control of Head Pose and Facial Expressions

为了生成逼真的头部说话，在保持准确的嘴唇同步的同时创建自然的头部运动至关重要。为了完成这项具有挑战性的任务，我们提出了 DisCoHead，这是一种无需监督即可解开和控制头部姿势和面部表情的新颖方法。 DisCoHead 使用单个几何变换作为瓶颈，从头部驱动视频中分离和提取头部运动 ...

0 0 0 0 2024/05/08 arXiv:2303.07697v1 bnexx

MAXIM: Multi-Axis MLP for Image Processing

Transformer 和多层感知器 (MLP) 模型的最新进展为计算机视觉任务提供了新的网络架构设计。尽管这些模型被证明在图像识别等许多视觉任务中是有效的，但将它们适应低级视觉仍然存在挑战。支持高分辨率图像的不灵活性和局部注意力的限制可能是主要瓶颈 ...

0 0 0 0 2024/04/25 arXiv:2201.02973v2 bnexx

RSFNet: A White-Box Image Retouching Approach using Region-Specific Color Filters

修饰图像是增强照片视觉吸引力的重要方面。尽管用户通常具有共同的审美偏好，但他们的修饰方法可能会根据个人喜好而有所不同。因此，需要一种白盒方法来产生令人满意的结果，并使用户能够同时方便地编辑图像 ...

0 0 0 0 2024/04/25 arXiv:2303.08682v2 bnexx

ReliableSwap: Boosting General Face Swapping Via Reliable Supervision

几乎所有先进的面部交换方法都使用重建作为代理任务，即仅当目标和源属于同一个人时才存在监督 ...

0 0 0 0 2024/04/01 arXiv:2306.05356v1 bnexx

GAN Prior Embedded Network for Blind Face Restoration in the Wild

从野外严重退化的人脸图像中进行盲脸恢复（BFR）是一个非常具有挑战性的问题。由于问题的严重性和复杂的未知退化，直接训练深度神经网络（DNN）通常无法得到可接受的结果。现有的基于生成对抗网络（GAN）的方法可以产生更好的结果，但往往会产生过度平滑的恢复 ...

0 0 0 0 2024/03/25 arXiv:2105.06070v1 bnexx

Exploiting Spatial Dimensions of Latent in GAN for Real-time Image Editing

生成对抗网络（GAN）从随机潜在向量合成真实图像。尽管操纵潜在向量可以控制合成输出，但使用 GAN 编辑真实图像会遇到以下问题：i) 将真实图像投影到潜在向量的耗时优化，ii) 或通过编码器嵌入不准确。我们提出StyleMapGAN：中间潜在空间具有空间维度，并且空间变异调制取代AdaIN ...

0 0 0 0 2024/03/21 arXiv:2104.14754v2 bnexx

MobileFaceSwap: A Lightweight Framework for Video Face Swapping

先进的换脸方法已经取得了令人瞩目的结果。然而，这些方法大多数都有很多参数和计算，这使得将它们应用于实时应用程序或将它们部署在手机等边缘设备上具有挑战性。在这项工作中，我们提出了一种轻量级的身份感知动态网络（IDN），通过根据身份信息动态调整模型参数来实现与主体无关的人脸交换 ...

0 0 0 0 2024/03/21 arXiv:2201.03808v1 bnexx

DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models

扩散模型在各种下游生成任务中取得了显着的成功，但在重要且具有挑战性的富有表现力的头部头像生成中仍未得到充分探索。在这项工作中，我们提出了一个 DreamTalk 框架来填补这一空白，该框架采用精心设计来释放扩散模型在生成富有表现力的头部的潜力。具体来说，DreamTalk 由三个关键组件组成：降噪网络、风格感知唇部专家和风格预测器 ...

0 0 0 0 2024/05/08 arXiv:2312.09767v1 bnexx