电化学电池是我们社会中普遍存在的设备。当它们被用于关键任务申请中时,在高度可变的环境和操作条件下,精确预测出院终结的能力对于支持运营决策至关重要。虽然在电池的电荷和排放阶段的过程中存在准确的预测模型,但衰老的建模及其对性能的影响仍然很少了解 ...
数据集大小的快速增长刺激了语音技术的发展。传统的语音模型通常依赖于大量标记的训练数据,这对于资源匮乏的语言来说是稀缺的。本文介绍了gigapeech 2,一个大规模、多领域、多语言的语音识别语料库 ... ...
无参考图像质量评估( nr-iqa(nr-iqa),现有的nr-iqa gan的失真图像上预测准确质量分数的需求。为此,我们提出了用于无参考图像质量评估(,我们提出了用于无参考图像质量评估(,我们提出了用于无参考图像质量评估(,的多维注意力网络,以提高基于gan的失真的性能... ...
大型语言模型(LLMS)由于高内存和运行时成本而难以处理长输入序列。内存仪的模型已成为解决此问题的有前途的解决方案,但是当前方法受到有限的内存能力的阻碍,需要昂贵的重新训练才能与新的LLM集成。在这项工作中,我们引入了一个关联内存模块,该模块可以与任何预先训练(冷冻)基于注意力的LLM耦合而无需重新训练,从而使其能够处理任意长的输入序列 ...
最近的细分市场模型(SAM)代表了缩放分割模型的重大突破,在RGB模式下的各种下游应用程序中提供了强劲的性能。但是,将SAM直接应用于新兴的视觉方式,例如深度和事件数据会导致多模式分割任务中的次优性能。在本文中,我们首次尝试通过提出针对不同输入视觉方式的低级适应专家(MOE-LORA)的混合物来调整SAM的多模式语义分割 ...
强化学习(RL)最近在机器人控制方面取得了巨大的成功。但是,RL中的大多数作品都在模拟的环境中运行(例如, ...
最近的工作表明, Transformer 模型能够对不同的NLP任务进行多任务处理,并有效地适应了新任务。但是,这些多任务模型的潜力可能会受到限制,因为它们使用相同的所有任务参数集。相比之下,人类通过对哪些技能和知识相关的适当推定并仅执行必要的计算来解决更加灵活的方式 ...
声学场景分类(ASC)是计算听觉场景分析中的关键研究问题,它旨在认识环境的独特声学特征。 ASC任务的挑战之一是训练和测试数据之间的域移动。自2018年以来,ASC挑战一直集中在ASC模型跨不同记录设备上的概括 ...