本文提出了提交给AEC-Challenge的实时声学回声取消(AEC)算法。该算法由三个模块组成:基于相变(GCC-PHAT)的广义互相关,基于相变(GCC-PHAT)的时间延迟补偿,加权递归最小二平方(WRL)线性自适应滤波和基于神经网络基于神经网络的残留回声抑制。 WRLS滤波器是从一种新型的半盲源分离的角度得出的 ...
3D高斯裂(3DGS)通过实现实时渲染,具有高级辐射场重建。然而,它依赖于编码颜色的几何形状和低阶球形谐波(SH)的依赖,限制了其捕获复杂几何形状和各种颜色的能力。我们引入了可变形的β剥落(DBS),这是一种可变形且紧凑的方法,可增强几何形状和颜色表示 ...
虽然3D高斯的碎片最近在神经渲染中很受欢迎,但当前的方法依靠精心设计的克隆和分裂策略来放置高斯人,这可能导致质量较差的效果图,并依赖良好的初始化。在这项工作中,我们将3D高斯人的集合重新考虑为一个随机样本,该样本是从描述场景中的物理表示的基本概率分布中绘制的,马尔可夫链链蒙特卡洛(MCMC)样本。在此视图下,我们表明3D高斯更新可以通过简单地引入噪声来转换为随机梯度Langevin Dynamics(SGLD)更新 ...
由于其在各个领域的出色性能,Transformer 已成为基础模型中的主要架构。然而,扩展这些模型的巨大成本仍然是一个重大问题。这个问题主要是由于它们对线性投影内固定数量的参数的依赖而产生的 ...
我们引入了 GaussianAvatars,这是一种创建逼真头部头像的新方法,在表情、姿势和视角方面完全可控。核心思想是基于 3D 高斯图的动态 3D 表示,该图被绑定到参数化可变形面部模型。这种组合有利于逼真的渲染,同时允许通过底层参数模型(例如动画)进行精确的动画控制 ...
分数蒸馏采样(SDS)已被证明是一个重要的工具,可以在数据匮乏的领域中使用大规模扩散先验来执行任务。不幸的是,SDS 有许多特征工件限制了它在通用应用中的用途。在本文中,我们通过将 SDS 及其变体视为求解从源分布到目标分布的最优成本传输路径,在理解 SDS 及其变体的行为方面取得了进展 ...