水下对象检测(UOD)旨在识别和将物体定位在水下图像或视频中,由于光学失真,水浊度和水下场景中的变化而面临重大挑战。近年来,基于人工智能(AI)的方法,尤其是深度学习方法,在UOD中表现出了有希望的表现。为了进一步促进未来的进步,我们全面研究了基于AI的UOD ...
0 0 0 2025/03/12 arXiv:2410.05577v1 meng
k-neartime邻居搜索的大多数精确方法都受到维数的诅咒;也就是说,他们的查询时间表现出对环境或内在维度的指数依赖性。动态连续索引(DCI)提供了一种有前途的方式来规避诅咒,并成功地降低了查询时间对固有维度的依赖性,从指数到sublinear。在本文中,我们提出了DCI的一种变体,我们将其称为优先级DCI,并在查询时间对固有维度的依赖性方面有了显着改善 ...
0 0 0 2025/03/12 arXiv:1703.00440v2 Daenerays
我们推出可变形的卷积V4(DCNV4),dcnv4通过两项关键增强解决了其前身dcnv3的局限性:1。 softmax归一化,以增强其动态属性和表达能力;2。 ... ...
0 0 0 2025/03/12 arXiv:2401.06197v1 cfb2713
深度神经网络已经在图像分类任务上取得了非凡的结果,但已证明对输入数据精心设计的扰动很容易受到攻击。尽管大多数攻击通常会改变许多图像像素的值,但已显示深网也容易受到输入的稀疏改变。但是,尚未提出计算高效的方法来计算稀疏的扰动 ...
0 0 0 2025/03/12 arXiv:1811.02248v4 DavidArgerichFan
推荐系统中的最新建议使用大型语言模型代表及其文本描述的项目。与仅项目ID模型(例如Bert4Rec)相比,它们在标准基准测试中显示出更好的结果。在这项工作中,我们重新审视了经常使用的Bert4Rec基线,并表明,通过进一步的调整,Bert4Rec明显胜过先前报道的数字,在某些数据集中,与最先进的模型具有竞争力 ...
0 0 0 2025/03/12 arXiv:2409.11699v2 Zophe
通过有限的硬件进行微调预训练的大型语言模型(LLMS),由于GPU内存限制而带来了挑战。已经提出了各种分布式微调方法来减轻GPU上的内存约束。但是,确定在给定环境中防止GPU的gpu范围内的最有效方法,同时又不清楚 ...
0 0 0 2025/03/12 arXiv:2404.10933v1 CG_Z
越来越多的研究作品融合了LiDAR和相机信息,以改善自动驾驶系统的3D对象检测。最近,一个简单而有效的融合框架取得了出色的检测性能,在统一的鸟类视图(BEV)空间中融合了LiDAR和相机功能。在本文中,我们提出了一个名为SimpleBev的LiDar-Camera Fusion框架,用于精确的3D对象检测,该框架分别遵循基于BEV的Fusion框架并改进相机和LIDAR编码器 ...
0 0 0 2025/03/12 arXiv:2411.05292v1 oneyhu
最近,开源大语言模型(LLM)的开发迅速发展。但是,由于数据限制,大多数开源LLM的功能主要集中在英语上。为了解决这个问题,我们介绍了$ \ textit {chat vector} $的概念,以配备预训练的语言模型,并通过简单模型算术进行指导和人为价值对齐 ...
0 0 0 2025/03/12 arXiv:2310.04799v3 zhuangxialie

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)