有效的K-Neartem邻居搜索是一项基本任务,是NLP中许多问题的基础。当相似度通过双重编码向量或$ \ ell_2 $ distance之间的点产物测量时,已经存在许多可扩展且有效的搜索方法。但是,当相似性通过更准确,更昂贵的黑盒神经相似性模型(例如交叉编码器)来衡量时并非如此,这些模型将共同编码查询和候选邻居 ...
0 0 0 2025/03/21 arXiv:2210.12579v1 Daenerays
事件日志分析是安全专业人员承担的重要任务。事件日志记录有关计算设备上发生的活动的关键信息,并且由于生成的大量事件,它们会消耗大量时间和资源进行分析。这项苛刻和重复的任务也容易出错 ...
0 0 0 2025/03/21 arXiv:2502.00677v1 zjumath
近年来,大型语言模型(LLMS)表现出了显着的功能,并推动了现实世界中的进步。但是,由于GPU的高内存和计算需求,对越来越长的输入序列的培训LLM构成了重大挑战。现有解决方案面临两个关键局限性:(1)减少内存技术,例如激活重新计算和CPU卸载,妥协培训效率; (2)分布式并行性策略需要过多的GPU资源,从而限制了输入序列长度的可扩展性 ...
0 0 0 2025/03/21 arXiv:2503.10377v1 anhao
基于深度学习的医学形象细分已取得了巨大的成功。但是,它通常需要广泛的像素级注释,这些注释既昂贵又耗时。半监督医学图像分割(SSMIS)提供了可行的替代方案,这是由CNN和VIT的进步驱动的。但是,这些网络通常依赖于单个固定激活功能和线性建模模式,从而限制了它们有效学习强大表示的能力 ...
端到端的自动驾驶在一个可区分的框架中统一任务,从而实现了面向计划的优化并吸引了日益增长的关注。当前的方法通过密集的历史鸟类视图(BEV)特征汇总了历史信息,或者是通过从检测中继承的范式来查询稀疏记忆库的。但是,我们认为这些范例要么省略运动计划中的历史信息,要么与其多步性性质保持一致,这需要预测或计划以后的多个时间步骤 ...
0 0 0 2025/03/21 arXiv:2503.14182v1 布朗瓶
传热是物质的基本特性。数十年来的研究试图发现具有出色的导热率的材料,但上限仍然未知。使用深度学习加速的晶体结构预测和第一原理计算,我们系统地探索了无机晶体的热导率景观 ...
0 0 0 2025/03/21 arXiv:2503.11568v1 TJ
尽管扩展大语言模型(LLM)的最新进展导致了许多NLP任务的改进,但尚不清楚这些模型是否主要使用一般Web文本培训的模型是否是高度专业化的安全关键领域(例如临床文本)中的正确工具。最近的结果表明,LLMS编码了令人惊讶的医学知识。这就提出了一个关于较小域特异性语言模型的效用的重要问题 ...
0 0 0 2025/03/21 arXiv:2302.08091v1 ppxia2008
深度卷积神经网络(DCNN)最近在语义图像分割方面表现出了出色的性能。但是,基于DCNN的最新语义分割方法通常由于使用复杂的网络体系结构而遭受高计算复杂性。这极大地限制了他们在需要实时处理的现实情况下的应用程序 ...
0 0 0 2025/03/21 arXiv:2003.08736v2 澹台心木

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)