在一次性设置下进行面部表情迁移在研究界越来越受欢迎,重点关注表情的精确控制。现有技术在感知表情方面展示了令人信服的结果,但它们缺乏对极端头部姿势的鲁棒性。他们还难以准确地重建背景细节,从而阻碍了真实感 ...
0 0 0 2024/05/03 arXiv:2404.14667v1 ForrestPi
语音驱动的3D面部动画技术已经发展多年,但其实际应用仍缺乏预期。主要挑战在于数据限制、嘴唇对齐和面部表情的自然度。尽管唇部对齐已经有许多相关研究,但现有的方法很难合成自然和真实的表情,导致面部动画出现机械和僵硬的外观 ...
0 0 0 2024/05/03 arXiv:2404.18604v1 ForrestPi
近年来,3D 头部说话领域取得了重大进展。该领域的一个显着挑战在于将语音相关运动与表情动态相结合,这主要是由于缺乏将口语句子多样性与各种面部表情结合起来的综合 3D 数据集造成的。尽管文献工作尝试利用 2D 视频数据和参数化 3D 模型作为解决方法,但在联合建模这两种运动时仍然显示出局限性 ...
0 0 0 2024/05/03 arXiv:2403.12886v1 ForrestPi
最佳滑雪路线选择是一项基于多种因素的挑战,例如陡度、指南针方向或拥挤程度。每个滑雪者对这些因素的个人偏好需要个体适应,这加剧了这项任务。该领域当前的方法没有将自动路由功能与用户偏好结合起来,错过了在分析过程中集成领域知识的可能性 ...
0 0 0 2024/05/03 arXiv:2307.08570v2 _xxt_
Mixtral是一种代表性的稀疏专家混合(SMoE)语言模型,由于其独特的模型设计和优越的性能而受到广泛关注。在Mixtral-8x7B-v0.1的基础上,本文提出了Chinese-Mixtral和Chinese-Mixtral-Instruct,通过进一步的预训练和指令微调,提高了汉语能力 ...
0 0 0 2024/05/03 arXiv:2403.01851v1 mlp
指令调优有潜力激发或增强大型语言模型 (LLM) 的特定功能。然而,实现数据的正确平衡对于防止灾难性遗忘和任务之间的干扰至关重要。为了解决这些限制并提高训练灵活性,我们提出了 Mixture-of-LoRAs (MoA) 架构,这是一种新颖且参数高效的调整方法,专为 LLM 的多任务学习而设计 ...
0 0 0 2024/05/03 arXiv:2403.03432v1 mlp
现有的基于学习的自动驾驶(AD)系统在理解高级信息、概括罕见事件和提供可解释性方面面临挑战。为了解决这些问题,这项工作采用大型语言模型 (LLM) 作为需要人类常识理解的复杂 AD 场景的决策组件。我们设计认知途径来实现 LLM 的全面推理,并开发算法将 LLM 的决策转化为可操作的驾驶命令 ...
0 0 0 2024/05/03 arXiv:2310.03026v2 卡崩卡
基于梯度的规划器广泛用于四旋翼局部规划,其中欧几里德符号距离场(ESDF)对于评估梯度大小和方向至关重要。然而,计算这样的场具有很多冗余,因为轨迹优化过程仅覆盖 ESDF 更新范围的非常有限的子空间。本文提出了一种无 ESDF 的基于梯度的规划框架,显着减少了计算时间 ...
0 0 0 2024/05/03 arXiv:2008.08835v2 yyyp

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)