3D异常检测和定位对于工业检查具有重要意义。先前的3D异常检测和本地化方法集中于测试数据与正常培训数据相同的类别的设置。但是,在实际应用程序中,由于数据隐私或导出控制法规等问题,目标3D对象的正常培训数据可能无法使用 ...
扩散 Transformer 在图像生成方面表现出了卓越的能力,但通常带有过多的参数化,导致实际应用中产生相当大的推理开销。在这项工作中,我们提出了 TinyFusion,一种深度修剪方法,旨在通过端到端学习从扩散变换器中删除冗余层。我们方法的核心原则是创建一个具有高可恢复性的剪枝模型,使其在微调后重新获得强大的性能 ...
这项调查全面回顾了机器学习中多模态对齐和融合的最新进展,这些进展受到文本、图像、音频和视频等数据类型日益多样化的推动。多模态集成通过利用不同模态之间的互补信息,以及在数据有限的情况下促进知识转移,提高模型的准确性和更广泛的适用性。我们系统地对现有的对齐和融合技术进行分类和分析,从对 200 多篇相关论文的广泛审查中汲取见解 ...
尽管深度神经网络(DNN)在许多领域表现出了解决大规模问题的强大能力,但由于其参数庞大,此类 DNN 很难部署在现实系统中。为了解决这个问题,提出了教师-学生架构,其中具有少量参数的简单学生网络可以实现与具有许多参数的深度教师网络相当的性能。最近,教师-学生架构已被有效且广泛地应用于各种知识蒸馏(KD)目标,包括知识压缩、知识扩展、知识适应和知识增强 ...
现有的工业异常检测方法主要集中于使用原始RGB图像的无监督学习。然而,RGB和3D数据对于异常检测都是关键,而在实际场景中数据集很少是完全干净的。为了解决上述问题挑战,本文首先研究了RGB-3D多模态噪声异常检测,提出了一种新颖的抗噪声M3DM-NR框架,利用CLIP强大的多模态判别能力... ...
尽管噪声和字幕质量已被认为是影响视觉语言对比预训练的重要因素,但在本文中,我们表明通过解决这些问题来改进训练过程的全部潜力尚未实现。具体来说,我们首先研究和分析影响训练的两个问题:负对的分配不正确,以及字幕质量和多样性较低。然后,我们设计有效的解决方案来解决这两个问题,这本质上需要使用多个真正的正对进行训练 ...
我们提出了一种新方法,用于无监督检测高分辨率,3d点云中的几何异常。特别是,我们建议将已建立的学生-教师异常检测框架适应三个维度。训练学生网络以匹配无异常点云上预训练教师网络的输出... ...
尽管图像异常检测和分割方面取得了重大进展,但很少有方法使用 3D 信息。我们利用最近推出的 3D 异常检测数据集来评估使用 3D 信息是否会失去机会。首先,我们提出了一个令人惊讶的发现:标准的纯颜色方法优于所有当前明确设计用于利用 3D 信息的方法 ...
异常检测旨在识别异常现象,这是科学和工业的核心任务。该任务本质上是无人监督的,因为训练期间异常是意外且未知的。自监督表示学习的最新进展直接推动了异常检测的改进 ...
工业缺陷检测通常通过异常检测(AD)方法来解决,其中没有或只有不完整的潜在发生缺陷的数据可用。这项工作发现了 AD 学生-教师方法中以前未知的问题,并提出了一种解决方案,其中训练两个神经网络为无缺陷训练示例产生相同的输出。学生-教师网络的核心假设是,两个网络的输出之间的距离对于异常来说较大,因为它们在训练中不存在 ...