从单视图像中生成人头的高质量360度视图对于启用可访问的沉浸式触觉应用程序和可扩展的个性化内容创建至关重要。虽然全部产量的尖端方法仅限于建模现实的人头,但最新的基于扩散的动态 - 友善的头部合成的方法只能产生正面视图,并与视图一致性斗争,从而阻止其转换为真正的3D模型,以从任意角度渲染。我们介绍了一种新颖的方法,可产生完全一致的360度头视图,可容纳人类,风格化和拟人形式,包括眼镜和帽子等配件 . ...
分阶段的多输入多输出(分阶段)雷达雷达越来越受到关注,因为它享受了波形多样性的优势和频率多样的阵列MIMO(FDA-MIMO)雷达的范围依赖性,而无需通过分区发射子阵列来牺牲相干处理增益。这个两部分的系列提出了一个受频率不同阵列(FDA)雷达启发的电子对策(ECM)的框架,称为FDA干扰,评估了其对抗机载的梯级模拟物雷达的有效性。该部分介绍了FDA干扰器的原理和类别,并提出了基于两个阶段MIMO雷 ...
尽管在近距离3D对象检测中深入学习取得了成功,但现有的方法在新型对象和摄像机配置中零弹性概括。我们介绍了Detany3D,这是一个迅速的3D检测基础模型,该模型能够仅使用单眼输入来检测任意摄像机配置下的任何新颖对象。培训3D检测的基础模型从根本上受到注释3D数据的可用性有限的限制,这激发了Detany3D利用广泛预先训练的2D基础模型嵌入的丰富先验知识来弥补这种稀缺性 ...
我们在用作个人代理的大型推理模型的推理轨迹中研究隐私泄漏。与最终输出不同,通常认为推理轨迹是内部和安全的。我们通过表明推理轨迹经常包含敏感用户数据来挑战这一假设,该数据可以通过提示注射或意外泄漏到输出中提取 ...
我们研究语言模型(LM)的持续训练和监督微调(SFT),以有效利用长上下文信息。我们首先建立一个可靠的评估协议来指导模型开发——我们使用一组广泛的长上下文任务,而不是困惑或简单的大海捞针(NIAH)测试,并在 SFT 后使用指令数据评估模型因为这可以更好地揭示长上下文能力。在我们强大的评估的支持下,我们进行了彻底的实验来决定继续预训练的数据组合、指令调整数据集和许多其他设计选择 ...
具有线性注意力的 Transformer 可以实现高效的并行训练,但同时可以表示为具有 2D(矩阵值)隐藏状态的 RNN,从而享受线性时间推理复杂性。然而,线性注意力通常不如普通的 softmax 注意力。此外,当前的线性注意力实现缺乏 I/O 感知,因此比高度优化的 softmax 注意力实现慢 ...
Hadamard产品(HP)长期以来一直是点击率(CTR)预测任务的基石,因为它的简单性,有效性和捕获没有其他参数的功能相互作用的能力。但是,其有效性的根本原因尚不清楚。在本文中,我们从二次神经网络(QNN)的角度重新访问了HP,该二次神经网络(QNN)利用二次交互术语来建模复杂的特征关系 ...
在音频驱动的人类动画中已经取得了重大进展,而大多数现有方法主要集中在面部运动上,从而限制了它们以自然同步和流动性创建全身动画的能力。他们还以精确的迅速控制而挣扎,以获得细粒度。为了应对这些挑战,我们引入了Omniavatar,这是一种创新的音频驱动的全身视频生成模型,可通过提高LIP-Sync的精度和自然动作来增强人类动画 ...