作为多视图学习和多标签分类的跨主题,近年来,多视图多标签分类逐渐获得了吸引力。多视图对比学习的应用进一步促进了这一过程,但是,现有的多视图对比学习方法粗略地将所谓的负面对分开,这在很大程度上导致了属于同一类别或相似类别的样本的分离。此外,许多多视图的多标签学习方法忽略了可能缺少观点和标签的方法 ...
多视图数据包含来自多种模式的信息,并具有为各种机器学习任务提供更全面的功能的潜力。多视图分析中的一个基本问题是其他视图带来的其他信息是什么,可以定量地识别此其他信息。在这项工作中,我们试图通过将纠缠的多视图功能分解为共享的潜在表示来应对这一挑战,这些特征在每个视图的所有视图和私人表示中都是常见的 ...
在许多实际任务中,功能正在发展,某些功能消失了,其他功能增加了。例如,在环境中监视某些传感器已过期的,而某些新的传感器则部署;在手机游戏建议中,一些游戏下降了,而一些新游戏却添加了。以这种增量和降低特征学习至关重要,但很少研究,尤其是当数据像流一样出现时,因此将整个数据保留以进行优化是不可行的 ...
我们提出了Unibind,这是一种灵活而有效的方法,它为七种不同方式学习了统一的表示空间 - 图像,文本,音频,点云,热,视频和事件数据。现有作品,例如,图像界,将图像视为中心形态,并构建以图像为中心的表示空间;但是,该空间可能是次优的,因为它导致了所有模式之间的不平衡表示空间 ...
在先前关于知识蒸馏的研究中,logit蒸馏的重要性经常被忽略。为了振兴logit蒸馏,我们通过基于逻辑的语义属性重新考虑其计算并探索如何更有效地利用它来介绍一种新的观点。逻辑通常包含大量的高级语义信息;但是,使用logits计算kullback-leibler(KL)差异的常规方法并不能解释其语义属性 ...
以前的知识蒸馏方法已经显示出他们在模型压缩任务上的令人印象深刻的表现,但是,很难解释他们转移的知识如何有助于提高学生网络的性能。在这项工作中,我们专注于提出一种具有高解释性和竞争性能的知识蒸馏方法。我们首先重新审视主流CNN模型的结构,并揭示拥有识别级别歧视输入区域的能力对于CNN执行分类至关重要 ...
最先进的蒸馏方法主要基于中间层的深层特征,而logit蒸馏的重要性被极大地忽略了。为了提供研究逻辑蒸馏的新观点,我们将经典的KD损失重新分为两个部分,即 ...
深层神经网络已经在众多应用程序中实现了最先进的性能,但是它们的高记忆和计算需求带来了重大挑战,尤其是在资源受限的环境中。模型压缩技术(例如低级别近似),通过降低这些网络的大小和复杂性,而仅牺牲精度,提供了有希望的解决方案。在本文中,我们为数据驱动的训练后低级压缩开发了一个分析框架 ...
近年来,随着网络深度和宽度的增加,深度神经网络(DNN)的性能一直在提升。为了在手机等边缘设备上启用DNN,研究人员提出了几种网络压缩方法,包括修剪,量化和分解。在基于分解的方法中,由于其扎实的理论原理和有效的实现,因此低级近似被广泛采用 ...
本文旨在加快卷积神经网络(CNN)的测试时间计算,尤其是非常深的CNN,这些CNN极大地影响了计算机视觉社区。与用于近似线性过滤器或线性响应的以前的方法不同,我们的方法将非线性单元考虑在内。我们在不需要随机梯度下降(SGD)的情况下为最终的非线性优化问题开发了有效的解决方案 ...