边界框回归(BBR)已被广泛用于对象检测和实例分割,这是对象定位的重要一步。但是,当预测的框具有与地面图框相同的纵横比时,无法优化边界框回归的大多数现有损耗函数,但是宽度和高度值完全不同。为了解决上述问题,我们完全探索了水平矩形的几何特征,并根据最小点距离提出了一个新颖的边界相似性比较指标mpdiou,其中包含现有损耗功能中所有相关因素,即在宽度或不可过地重叠区域,中心距离和偏差的过程中,并简化了 ...
0 0 0 2025/08/21 arXiv:2307.07662v1 18165929621
 Transformer 中的注意机制是准确可扩展的序列建模的重要原始性。它的二次计算和线性内存复杂性仍然是显着的瓶颈。线性注意力和状态空间模型实现线性时间,恒定内存序列建模,并且可以通过跨序列长度富含矩阵的并行化来有效地训练 ...
0 0 0 2025/08/21 arXiv:2506.04761v2 hwrabbit
移动边缘计算(MEC)启用的空中网络是6G的关键组成部分,采用航空站(ABSS),例如无人驾驶飞机(UAV)(UAV)和高空平台站(HAPS),为地面IoT设备(IOTDS)提供动态服务。这些IOTD支持实时应用程序(例如 ...
0 0 0 2025/08/21 arXiv:2503.03391v1 xsxsxsxsxs
开发人员越来越多地使用代码大语言模型(代码LLM)来提高生产力,但它们通常会生成脆弱的代码。因此,迫切需要确保Code LLMS生成的代码正确且安全。先前的研究主要集中于生成安全的代码,忽略了安全代码也需要正确的事实 ...
0 0 0 2025/08/21 arXiv:2405.00218v3 co_ode
感知和理解高度动态和不断变化的环境是机器人自主权的关键能力。尽管已经在开发机器人姿势准确的动态大满贯方法方面取得了长足的进步,但较少的重点是构建机器人环境的密集时空表示。对场景及其在时间演变的详细理解对于长期的机器人自主权至关重要,对于需要长期推理的任务至关重要,例如在与人类和其他代理商共享的环境中有效运行,因此要经受短期和长期的动态 ...
0 0 0 2025/08/21 arXiv:2402.13817v2 weanhear
我们为树生的 Transformer 架构和培训策略提供了建议。该体系结构以多种分辨率处理数据,并具有沙漏形状,中间层处理的 Token 少于外层。与卷积网络类似,我们引入了更长的范围跳过连接到完成此多分辨率方法 ...
0 0 0 2025/08/21 arXiv:2502.04762v1 happy
社会导航是自治人(例如机器人)在其他智能代理(例如人类)的面前以“社会符合社会规定”方式导航的能力。随着人口稠密环境中自动导航移动机器人的出现(例如 ...
0 0 0 2025/08/21 arXiv:2203.15041v2 weanhear
我们介绍了视觉注意力蒸馏(VI-LAD),这是一种新颖的方法,用于将社会符合性的导航知识从大型视觉语言模型(VLM)提炼为实时机器人导航的轻质 Transformer 模型。与依靠专家演示或人类宣传数据集的传统方法不同,VI-LAD在中间层表示级别(即 ...
0 0 0 2025/08/21 arXiv:2503.09820v1 weanhear

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)