音频质量评估对于评估声音的感知现实主义至关重要。但是,获得“黄金标准”判断的时间和费用限制了此类数据的可用性。对于AR&VR,良好的可感知声音质量和来源的可本质性是确保完全沉浸在用户中的关键要素 ...
最近的语音言语增强最近取得了惊人的进步。但是,其性能受到单个麦克风可用的有限空间提示的限制。为了克服这一限制,我们引入了一种策略,将单声道语音映射到固定的模拟空间中,以更好地分化目标语音和噪声 ...
在嘈杂条件下,自动语音识别(ASR)系统的性能急剧降低。作为特征补偿步骤,显式失真建模(EDM)能够通过模拟清洁对应物中的内域嘈杂演讲来增强ASR系统。但是,现有的失真模型是不可验证的,也无法解释的,并且通常缺乏可控性和概括能力 ...
知识编辑旨在更新大语模型(LLMS)中过时或不正确的知识。但是,当前的知识编辑方法的终身编辑可扩展性有限。这项研究探讨了知识编辑终身编辑失败的基本原因 ...
罗马和MEMIT在很大程度上被认为是两种不同的模型编辑算法,它们之间的主要区别是进行分批编辑的能力。在本文中,我们将这两种算法在单个概念保护伞下统一,以优化相同的目标,我们称之为保存途径目标。罗马使用平等约束来优化此目标以一次执行一个编辑,而Memit采用更灵活的最小二乘约束,可以进行批处理编辑 ...
在分析人类运动视频时,现有姿势估计器的输出抖动高度不平衡,范围内的估计误差各不相同。视频中的大多数框架相对容易估计,并且仅遭受轻微的烦恼。相比之下,对于很少见到或遮挡的作用,多个关节的估计位置很大程度上偏离了连续的框架序列的地面真实价值,从而在它们上引起了重大的烦恼 ...
轨迹预测对于自动驾驶至关重要,因为它的目的是预测交通参与者的未来运动。传统方法通常对智能体的轨迹进行整体推理,忽略了智能体之间预测难度的差异。本文提出了一种新颖的难度引导特征增强网络(DGFNet),它利用代理之间的预测难度差异进行多代理轨迹预测 ...
长期以来,培训跨任务和领域的AI模型一直是推动AI研究的开放问题之一。基础模型的出现使得为给定任务获得专家模型变得更加容易,但是在测试时间可能遇到的数据的异质性通常意味着任何单一专家都不足。我们认为专家(敌人)的融合是将专家模型与数据分配的补充知识融合的问题,并将其作为监督学习的实例 ...