人类活动识别(HAR)使用可穿戴设备(例如嵌入惯性测量单元(IMU)传感器)的智能手表具有与我们的日常生活相关的各种应用,例如锻炼跟踪和健康监测。在本文中,我们提出了一种新型的基于注意力的人类活动识别方法,该方法使用在不同人体位置佩戴的多个IMU传感器。首先,通过传感器的特征提取模块旨在从具有卷积神经网络(CNN)的单个传感器中提取最判别的特征 ...
大型语言模型(LLM)在推理期间由于高带宽内存(HBM)带宽约束而表现出明显的记忆结合特性。在本文中,我们提出了一个面向L2的异步KV缓存预摘要方法,以通过计算载荷重叠在LLM推理中突破内存带宽瓶颈。通过在主动计算窗口中策略性地安排空闲内存带宽,我们的方法主动预取需要KV缓存到GPU L2缓存中,从而使高速L2高速缓存命中可用于后续访问,并有效地将HBM访问延迟隐藏在计算周期内 ...
大型语言模型 (LLM) 在利用工具方面取得了重大进展,但其能力受到 API 可用性和隐式推理的不稳定性的限制,特别是在涉及规划和执行时。为了克服这些限制,我们提出了 CREATOR,这是一种新颖的框架,使 LLM 能够使用文档和代码实现来创建自己的工具。 CREATOR 解开了抽象工具创建和具体决策执行的关系,从而提高了性能 ...
当跨域应用时,跨域少数射击对象检测(CD-FSOD)对现有对象检测和几个射击检测模型构成了重大挑战。与NTIRE 2025结合使用,我们组织了第一届CD-FSOD挑战,旨在提高当前对象探测器在完全新颖的目标域上的性能,仅具有有限的标记数据。挑战吸引了152名注册参与者,收到了42支球队的意见书,并结束了13个团队进行有效的最终提交 ...
网络架构在基于深度学习的计算机视觉系统中起着关键作用。广泛使用的卷积神经网络和 Transformer 将图像视为网格或序列结构,这对于捕获不规则和复杂的物体并不灵活。在本文中,我们建议将图像表示为图结构,并引入一种新的视觉gnn(vig)架构来提取视觉任务的图级特征... ...
最近,由于其事件驱动和节能的特征,受脑启发的尖峰神经元网络(SNN)引起了广泛的研究兴趣。尽管如此,由于其激活函数的非差异性,很难有效地训练深SNN,这可以禁用传统人工神经网络(ANN)的典型使用梯度下降方法。尽管替代梯度(SG)的采用正式允许损失的后传播,但离散的尖峰机制实际上将SNN的损失格局与ANN的损失格局区分开,使替代梯度方法失败,无法获得与ANN相当的准确性 ...
为了模拟人类行为的不确定性,随机轨迹预测需要对未来轨迹的复杂多模式分布。新兴的扩散模型揭示了它们在众多一代任务中的巨大表示能力,显示了随机轨迹预测的潜力。但是,昂贵的时间消耗可以阻止实时预测的扩散模型,因为需要大量的剥离步骤来确保足够的表示能力 ...
蛋白质表示学习对于众多生物学任务至关重要。最近,在大规模蛋白质序列上预测的基于 Transformer 的大型蛋白质语言模型(PLM)在基于序列的任务上表现出了显着成功。但是,PLM缺乏结构信息 ...