图神经网络(GNN)是最受欢迎的深度学习研究主题之一。 GNN方法通常是在图形信号处理理论之上设计的。特别是,扩散方程已被广泛用于设计GNN的核心处理层,因此它们不可避免地容易受到臭名昭著的超平滑尺寸问题的影响 ...
近年来,对比性语言图像预训练(剪辑)已成为多模式智能的基石。但是,最近的研究表明,剪辑编码过程中的信息丢失是很大的,夹子倾向于仅捕获输入中的粗粒粒度特征。这种缺陷显着限制了单个剪辑模型处理富含视觉细节的图像的能力 ...
股票价格预测在定量投资中至关重要。现有方法遇到了两个主要问题:首先,他们经常忽略捕获短期库存波动来预测高挥发性回报的关键作用。其次,主流方法依靠图或注意机制,不充分地探索库存之间的时间关系,通常会随着时间的推移和之后的特征和因果关系而模糊 ...
机器学习模型也总是做出预测,即使可能不准确。在许多决策支持申请中,应该避免这种行为,因为错误可能会带来严重的后果。尽管已经在1970年学习过,但最近有拒绝的机器学习引起了人们的兴趣 ...
年龄转换的任务说明了个人外观随着时间的变化。准确地对输入面部图像进行对这种复杂的转换进行建模非常具有挑战性,因为它需要令人信服,可能对面部特征和头部形状进行大规模更改,同时仍保留输入身份。在这项工作中,我们提出了一种图像到图像翻译方法,该方法学会将真实的面部图像直接编码到预先训练的无条件gan的潜在空间中(e ...
我们提出了梯度加权对象检测器激活图(ODAM),这是一种可视化的解释技术,用于解释对象检测器的预测。 ODAM利用流入中间特征图的探测器靶标的梯度,产生热图,显示区域对检测器对每个预测属性的决策的影响。与以前的作品分类激活图(CAM)相比,ODAM生成了实例特定的解释,而不是特定于类的解释 ...
该技术报告概述了我们针对Chime-8 Notsofar-1挑战的提交系统。这项挑战的主要困难是在各个会议室中记录的数据集,该数据集捕获了现实世界中的复杂性,例如高重叠率,背景噪声,可变数量的扬声器和自然对话风格。为了解决这些问题,我们在几个方面优化了系统:对于前端语音信号处理,我们引入了一种数据驱动的诊断和分离(JDS)的联合训练方法,以提高音频质量 ...
语言模型(LMS)通过其专有信息处理能力在推理和深入的财务分析方面表现出了特殊性。先前的研究重点是评估分类性能,同时经常忽略了解释性或预先构想的说明对应于更高的分类准确性。在金融领域使用公共数据集,我们通过LMS定量评估了自我解释,专注于它们的事实和因果关系 ...