旨在建模图表的时间不断发展的性质的时间图学习,最近引起了人们的关注并取得了非凡的表现。但是,实际上,图形结构通常是不完整且嘈杂的,这阻碍了时间图网络(TGN)学习信息性表示。图对比度学习使用数据增强来生成现有数据的合理变化并学习强大的表示 ...
卷积是CNN的基本构件。它们的权重在空间上分担的事实是其广泛使用的主要原因之一,但这也是一个主要限制,因为它使卷积的内容不可知。我们提出了一个像素自动卷积(PAC)操作,这是对标准卷积的简单而有效的修改,其中滤波器的权重乘以空间变化的内核,该内核取决于可学习的本地像素特征 ...
由于因果推理能力有限,端到端(E2E)自主驾驶方法仍在努力在交互式闭环评估中做出正确的决定。当前的方法试图利用视觉模型(VLM)的强大理解和推理能力来解决这一困境。但是,由于语义推理空间和动作空间中纯粹的数值轨迹输出之间的差距,因此,在闭环评估中,几乎没有E2E方法的VLM在闭环评估中表现良好 ...
在本章中,我们认为,对当代建筑语法学家对建筑语法和人工智能研究领域之间的牢固关系有深入的了解是非常有利的。我们首先阐明两个领域之间的历史联系,表明它们的关系源于对人类交流和语言的共同态度。然后,我们讨论了影响的第一个方向,尤其要专注于人工智能领域的洞察力和技术如何在操作,验证和扩展建筑主义者对语言的方法中起重要作用 ...
作为一项新兴的视频理解任务,顺序的视频理解由于其目标性质引起了许多研究人员的关注。本文研究了弱监督的顺序视频,理解未提供准确的时标文本视频对齐方式。我们通过从剪辑中借用想法来解决这项任务 ...
早期退出已成为提高深网推理效率的有前途的方法。通过与多个分类器(退出)构建模型,可以在早期出口处生成``简易''样本的预测,从而消除执行更深层的需求。当前的多EXIT网络通常在中间层实现线性分类器,引人入胜的低级功能可以封装高级语义 ...
我们建议使用概念瓶颈模型(CBM)进行一种新颖的结构和可解释分类的方法。尽管SOTA将图像分类任务作为黑匣子工作,但对模型的需求不断增长,该模型将提供解释的结果。这样的模型通常会使用此目标实例的其他描述(称为概念)学会预测班级标签的分布 ...
特定于领域的智能要求解决问题的专业知识和复杂的推理,对大型语言模型(LLM)提出了重大挑战,这些模型(LLMS)与知识幻觉和在约束参数预算下的推理能力不足。受Bloom在教育理论中的分类学的启发,我们提出了检索提示的推理建模(稀有),这是一种新颖的范式,它使知识存储无法储存推理优化。稀有将域知识的外部化为可检索的来源,并在训练过程中内化了特定于领域的推理模式 ...