无监督的域改编(UDA)旨在利用从标记的源数据集中学到的知识来解决新的未标记域中的类似任务。先前的UDA方法通常需要在学习适应模型时访问源数据,从而使它们具有风险和无效的分散私人数据。这项工作可以解决一个实际的环境,在该设置中,只有一个训练有素的源模型,并研究了我们如何在没有源数据的情况下有效地利用此类模型来解决UDA问题 ...

0 0 0 0 2025/03/10 arXiv:2002.08546v6 LJH

声学场景分类(ASC)是计算听觉场景分析中的关键研究问题,它旨在认识环境的独特声学特征。 ASC任务的挑战之一是训练和测试数据之间的域移动。自2018年以来,ASC挑战一直集中在ASC模型跨不同记录设备上的概括 ...

0 0 0 0 2025/03/07 arXiv:2402.02694v2 LJH

当代域的适应性提供了一种实用解决方案,用于实现标记的源数据和未标记的目标数据之间语义分割的跨域转移。这些解决方案已广泛受欢迎。但是,它们要求在测试环境变化时进行重新培训。由于耗时的培训过程以及对数据隐私的疑虑,这可能会导致某些应用中的成本难以忍受 ...

0 0 0 0 2025/03/05 arXiv:2309.14241v1 LJH

标签有效语义分割的症结在于产生高质量的伪标记,以利用大量未标记或弱标记的数据。一个普遍的做法是,将高度自信的预测作为每个像素的伪地真相,但这会导致一个问题,即由于它们的不可靠性,大多数像素可能未使用。但是,我们认为每个像素都与模型训练有关,甚至是那些不可靠和模棱两可的像素 ...

0 0 0 0 2025/02/28 arXiv:2306.02314v2 LJH

本文解决了在嘈杂和混响环境中单个语音源的双耳定位问题。对于给定的双耳麦克风设置,对应于单个源的直接路径传播的双耳响应是源方向的函数。实际上,这种反应受到噪音和混响的污染 ...

0 0 0 0 2025/02/11 arXiv:1509.03205v3 LJH

直接路径相对传递函数(DP-RTF)是指两个麦克风通​​道的直接路径声传递函数之间的比率。尽管DP-RTF完全编码声音空间提示并用作可靠的定位功能,但通常会在噪声和混响的存在下错误地估计它。本文提议学习具有深层神经网络的DP-RTF,以进行强大的双耳声源定位 ...

0 0 0 0 2025/02/11 arXiv:2202.07841v1 LJH

混响环境中的准确声音定位对于人类听觉感知至关重要。最近,卷积神经网络(CNN)已用于对双耳人类听觉途径进行建模。但是,CNN显示出捕获全球声学特征的障碍 ...

0 0 0 0 2025/02/07 arXiv:2207.03927v2 LJH

声音事件检测和本地化(SELD)是识别声音事件及其相应到达方向(DOA)的一项组合任务。尽管该任务具有许多应用程序,并且近年来已经对其进行了广泛的研究,但它未能提供有关声源位置的完整信息。在本文中,我们通过将任务扩展到声音事件检测,距离估计(3D SELD)来克服此问题 ...

0 0 0 0 2025/02/04 arXiv:2403.11827v2 LJH

无监督的域适应性解决了在未标记的目标域中分类数据的问题,鉴于标记为共享共同标签空间但遵循不同分布的标记的源域数据。最近的大多数方法采用了两个域之间明确对齐特征分布的方法。不同的是,以域适应性的基本假设为动机,我们将域的适应性问题重新列为目标数据的歧视性聚类,鉴于由密切相关,标记的源数据提供的强大特权信息 ...

0 0 0 0 2025/02/03 arXiv:2302.11984v1 LJH

深度卷积神经网络(CNN)学习判别性光谱式模式的能力使它们非常适合环境声音分类。但是,标记数据的相对稀缺阻碍了这种高容量模型家族的开发。这项研究有两个主要的贡献:首先,我们提出了一个深层卷积神经网络架构,用于环境声音分类 ...

0 0 0 0 2025/02/01 arXiv:1608.04363v2 LJH

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)