时空预测学习旨在通过从历史框架中学习来产生未来的框架。在本文中,我们研究了现有的方法,并提出了时空预测学习的一般框架,其中空间编码器和解码器捕获框内特征和中间时间模块捕获框架间相关性。尽管主流方法采用经常性单元来捕获长期的时间依赖性,但由于无法平行的架构,它们的计算效率低 ...
单图像对许多高级计算机视觉任务很重要,因为雨条可能会严重降低图像的可见性,从而影响图像的识别和分析。最近,已经提出了许多基于CNN的方法来清除降雨。尽管这些方法可以消除一部分雨条,但他们很难适应现实世界中的场景并恢复具有清晰准确的结构的高质量无雨图像 ...
对称正定(SPD)矩阵学习方法在许多图像和视频处理任务中都变得流行,这要归功于他们在尊重基础SPD歧管的Riemannian几何形状的同时学习适当的统计表示。在本文中,我们构建了Riemannian网络体系结构,以在深层模型中打开SPD矩阵非线性学习的新方向。 In particular, we devise bilinear mapping layers to transform input SPD matrices to more desirable SPD matrices, exploit eigenvalue rectification layers to apply a non-linear activation function to the new SPD matrices, and design an eigenvalue logarithm layer to perform Riemannian computing on the resulting SPD matrices for regular output layers. ...
图像恢复是旨在从损坏的输入图像(例如Deblurring和deraining)中获得高质量图像的任务。在图像恢复中,通常有必要在空间细节和上下文信息之间保持复杂的平衡。尽管多阶段网络可以最佳地平衡这些竞争目标并实现出色的性能,但这也提高了系统的复杂性 ...
由于其独特的对象特征(即显着性和伪装),实现显着对象检测(SOD)和伪装对象检测(COD)的联合学习和伪装的对象检测(COD)非常具有挑战性 ...
在本文中,我们研究了原始点云中3D对象分割的问题。与通常需要大量人类注释以进行全面监督的所有现有方法不同,我们提出了第一种称为OGC的无监督方法,即同时在单个正向通行证中同时识别多个3D对象,而无需任何类型的人类注释。我们方法的关键是,将动态运动模式完全利用在顺序点云上的动态运动模式,因为监督信号自动发现刚性对象 ...
图像旨在提高因多雨条件而损坏的图像的可见性,以取消降解元素,例如雨条,雨滴和雨水积聚。尽管许多单一图像驱动方法在空间域内显示出令人鼓舞的结果,但现实世界中的降雨降解通常会在图像的整个频谱中造成不均匀的损害,这在增强不同频率组件方面对这些方法构成了挑战。在本文中,我们介绍了一种新型的端到端自适应频率增强网络(AFENET),专门针对跨各种频率的单个图像驱动,该图像可自适应增强图像 ...
混合CNN转换器模型旨在结合卷积神经网络(CNN)和 Transformer 的优势,以有效地对局部信息和远程依赖性进行建模。但是,大多数研究倾向于集中于整合CNN和 Transformer 的空间特征,同时忽略了频道特征的关键重要性。这对于低质量医学图像分割中的模型性能尤为重要 ...
在神经形态芯片上利用尖峰神经网络(SNN)的神经形态计算是传统AI的有前途的节能替代品。基于CNN的SNN是神经形态计算的当前主流。相比之下,没有专门针对刚刚出现的 Transformer 的SNN设计神经形态芯片,它们的性能仅与基于CNN的SNN相当,没有明显的优势 ...
尖峰神经网络(SNN)由于其独特的基于尖峰的事件驱动的性质而成为传统人工神经网络(ANN)的节能替代品。编码在SNN中至关重要,因为它将外部输入刺激转换为时空特征序列。但是,大多数现有的深SNN依赖于产生无能为力的尖峰表示的直接编码,并且缺乏人类视力中固有的时间动态 ...