一译 —— 文档和论文翻译、对照阅读、讨论和社区

SAQAM: Spatial Audio Quality Assessment Metric

音频质量评估对于评估声音的感知现实主义至关重要。但是，获得“黄金标准”判断的时间和费用限制了此类数据的可用性。对于AR＆VR，良好的可感知声音质量和来源的可本质性是确保完全沉浸在用户中的关键要素 ...

0 0 0 2025/04/04 arXiv:2206.12297v1 wenwen

SE Territory: Monaural Speech Enhancement Meets the Fixed Virtual Perceptual Space Mapping

最近的语音言语增强最近取得了惊人的进步。但是，其性能受到单个麦克风可用的有限空间提示的限制。为了克服这一限制，我们引入了一种策略，将单声道语音映射到固定的模拟空间中，以更好地分化目标语音和噪声 ...

0 0 0 2025/04/04 arXiv:2311.01679v2 wenwen

DENT-DDSP: Data-efficient noisy speech generator using differentiable digital signal processors for explicit distortion modelling and noise-robust speech recognition

在嘈杂条件下，自动语音识别（ASR）系统的性能急剧降低。作为特征补偿步骤，显式失真建模（EDM）能够通过模拟清洁对应物中的内域嘈杂演讲来增强ASR系统。但是，现有的失真模型是不可验证的，也无法解释的，并且通常缺乏可控性和概括能力 ...

0 0 0 2025/04/04 arXiv:2208.00987v1 wenwen

Knowledge in Superposition: Unveiling the Failures of Lifelong Knowledge Editing for Large Language Models

知识编辑旨在更新大语模型（LLMS）中过时或不正确的知识。但是，当前的知识编辑方法的终身编辑可扩展性有限。这项研究探讨了知识编辑终身编辑失败的基本原因 ...

0 0 0 2025/04/04 arXiv:2408.07413v3 chaospler

A Unified Framework for Model Editing

罗马和MEMIT在很大程度上被认为是两种不同的模型编辑算法，它们之间的主要区别是进行分批编辑的能力。在本文中，我们将这两种算法在单个概念保护伞下统一，以优化相同的目标，我们称之为保存途径目标。罗马使用平等约束来优化此目标以一次执行一个编辑，而Memit采用更灵活的最小二乘约束，可以进行批处理编辑 ...

0 0 0 2025/04/04 arXiv:2403.14236v5 chaospler

SmoothNet: A Plug-and-Play Network for Refining Human Poses in Videos

在分析人类运动视频时，现有姿势估计器的输出抖动高度不平衡，范围内的估计误差各不相同。视频中的大多数框架相对容易估计，并且仅遭受轻微的烦恼。相比之下，对于很少见到或遮挡的作用，多个关节的估计位置很大程度上偏离了连续的框架序列的地面真实价值，从而在它们上引起了重大的烦恼 ...

0 0 0 2025/04/04 arXiv:2112.13715v2 yanyu

Multi-Agent Trajectory Prediction with Difficulty-Guided Feature Enhancement Network

轨迹预测对于自动驾驶至关重要，因为它的目的是预测交通参与者的未来运动。传统方法通常对智能体的轨迹进行整体推理，忽略了智能体之间预测难度的差异。本文提出了一种新颖的难度引导特征增强网络（DGFNet），它利用代理之间的预测难度差异进行多代理轨迹预测 ...

0 0 0 2025/04/04 arXiv:2407.18551v3 longgangganggang

Fusing Models with Complementary Expertise

长期以来，培训跨任务和领域的AI模型一直是推动AI研究的开放问题之一。基础模型的出现使得为给定任务获得专家模型变得更加容易，但是在测试时间可能遇到的数据的异质性通常意味着任何单一专家都不足。我们认为专家（敌人）的融合是将专家模型与数据分配的补充知识融合的问题，并将其作为监督学习的实例 ...

0 0 0 2025/04/04 arXiv:2310.01542v2 wgkooo

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）