生成对抗方法在根据特定样式或视觉领域制作图像中的有效性最近打开了新的方向来解决无监督的域适应问题。已经表明,可以将标记为图像的源图像进行修改以模拟目标样本,即使原始缺乏带注释的数据,也可以直接训练目标域中的分类器。还已经评估了从目标到源域的逆映射,但仅通过适应的特征空间,因此没有新的图像生成 ...
对于语义图像分割的域适应性非常必要,因为用像素级标签手动标记大型数据集很昂贵且耗时。现有的域适应技术可以在有限的数据集上起作用,或者与监督学习相比产生的性能不佳。在本文中,我们提出了一个新型的双向学习框架,用于分割的领域适应 ...
域的适应性(DA)引起了其适应在标记的源数据上训练的模型以在未标记或弱标记的目标数据上训练的模型的能力,从而引起了很高的兴趣。最常见的DA技术需要同时访问源域和目标域的输入图像。但是,实际上,隐私问题通常会阻碍适应阶段的源图像的可用性 ...
无监督的域改编(UDA)旨在利用从标记的源数据集中学到的知识来解决新的未标记域中的类似任务。先前的UDA方法通常需要在学习适应模型时访问源数据,从而使它们具有风险和无效的分散私人数据。这项工作可以解决一个实际的环境,在该设置中,只有一个训练有素的源模型,并研究了我们如何在没有源数据的情况下有效地利用此类模型来解决UDA问题 ...
声学场景分类(ASC)是计算听觉场景分析中的关键研究问题,它旨在认识环境的独特声学特征。 ASC任务的挑战之一是训练和测试数据之间的域移动。自2018年以来,ASC挑战一直集中在ASC模型跨不同记录设备上的概括 ...
当代域的适应性提供了一种实用解决方案,用于实现标记的源数据和未标记的目标数据之间语义分割的跨域转移。这些解决方案已广泛受欢迎。但是,它们要求在测试环境变化时进行重新培训。由于耗时的培训过程以及对数据隐私的疑虑,这可能会导致某些应用中的成本难以忍受 ...
标签有效语义分割的症结在于产生高质量的伪标记,以利用大量未标记或弱标记的数据。一个普遍的做法是,将高度自信的预测作为每个像素的伪地真相,但这会导致一个问题,即由于它们的不可靠性,大多数像素可能未使用。但是,我们认为每个像素都与模型训练有关,甚至是那些不可靠和模棱两可的像素 ...
本文解决了在嘈杂和混响环境中单个语音源的双耳定位问题。对于给定的双耳麦克风设置,对应于单个源的直接路径传播的双耳响应是源方向的函数。实际上,这种反应受到噪音和混响的污染 ...
直接路径相对传递函数(DP-RTF)是指两个麦克风通道的直接路径声传递函数之间的比率。尽管DP-RTF完全编码声音空间提示并用作可靠的定位功能,但通常会在噪声和混响的存在下错误地估计它。本文提议学习具有深层神经网络的DP-RTF,以进行强大的双耳声源定位 ...
混响环境中的准确声音定位对于人类听觉感知至关重要。最近,卷积神经网络(CNN)已用于对双耳人类听觉途径进行建模。但是,CNN显示出捕获全球声学特征的障碍 ...