水下对象检测(UOD)旨在识别和将物体定位在水下图像或视频中,由于光学失真,水浊度和水下场景中的变化而面临重大挑战。近年来,基于人工智能(AI)的方法,尤其是深度学习方法,在UOD中表现出了有希望的表现。为了进一步促进未来的进步,我们全面研究了基于AI的UOD ...
k-neartime邻居搜索的大多数精确方法都受到维数的诅咒;也就是说,他们的查询时间表现出对环境或内在维度的指数依赖性。动态连续索引(DCI)提供了一种有前途的方式来规避诅咒,并成功地降低了查询时间对固有维度的依赖性,从指数到sublinear。在本文中,我们提出了DCI的一种变体,我们将其称为优先级DCI,并在查询时间对固有维度的依赖性方面有了显着改善 ...
我们推出可变形的卷积V4(DCNV4),dcnv4通过两项关键增强解决了其前身dcnv3的局限性:1。 softmax归一化,以增强其动态属性和表达能力;2。 ... ...
深度神经网络已经在图像分类任务上取得了非凡的结果,但已证明对输入数据精心设计的扰动很容易受到攻击。尽管大多数攻击通常会改变许多图像像素的值,但已显示深网也容易受到输入的稀疏改变。但是,尚未提出计算高效的方法来计算稀疏的扰动 ...
推荐系统中的最新建议使用大型语言模型代表及其文本描述的项目。与仅项目ID模型(例如Bert4Rec)相比,它们在标准基准测试中显示出更好的结果。在这项工作中,我们重新审视了经常使用的Bert4Rec基线,并表明,通过进一步的调整,Bert4Rec明显胜过先前报道的数字,在某些数据集中,与最先进的模型具有竞争力 ...
通过有限的硬件进行微调预训练的大型语言模型(LLMS),由于GPU内存限制而带来了挑战。已经提出了各种分布式微调方法来减轻GPU上的内存约束。但是,确定在给定环境中防止GPU的gpu范围内的最有效方法,同时又不清楚 ...
越来越多的研究作品融合了LiDAR和相机信息,以改善自动驾驶系统的3D对象检测。最近,一个简单而有效的融合框架取得了出色的检测性能,在统一的鸟类视图(BEV)空间中融合了LiDAR和相机功能。在本文中,我们提出了一个名为SimpleBev的LiDar-Camera Fusion框架,用于精确的3D对象检测,该框架分别遵循基于BEV的Fusion框架并改进相机和LIDAR编码器 ...
最近,开源大语言模型(LLM)的开发迅速发展。但是,由于数据限制,大多数开源LLM的功能主要集中在英语上。为了解决这个问题,我们介绍了$ \ textit {chat vector} $的概念,以配备预训练的语言模型,并通过简单模型算术进行指导和人为价值对齐 ...