现有方法通过合并辅助一对多的分配来增强检测 Transformer 的训练。在这项工作中,我们将模型视为一个多任务框架,同时执行一对一和一对一的预测。我们研究了在这两个训练目标中,每个组件在 Transformer 解码器中的作用,包括自我注意力,交叉注意力和前馈网络 ...
0 0 0 2025/07/14 arXiv:2412.10028v4 argbunint256
LiDAR语义分割在自主驾驶中起着至关重要的作用。现有的基于Voxel的LIDAR语义分割方法将统一分区应用于3D LiDAR Point Cloud,以基于笛卡尔/圆柱坐标形成结构化表示。尽管这些方法显示出令人印象深刻的性能,但现有基于体素的方法的缺点仍然存在两个方面:(1)它需要足够大的输入素分辨率分辨率,这带来了大量的计算成本和内存消耗 ...
0 0 0 2025/07/14 arXiv:2505.24634v2 wenzhanwujian
使用大型语言模型(LLMS)评估答案质量的生成奖励模型(也称为LLMS-AS-judges)在具有可验证的奖励(RLVR)的增强学习中越来越多地采用。它们通常比基于严格的规则指标更喜欢,尤其是对于涉及自由形式产出的复杂推理任务。在此范式中,通常会提示LLM将候选人答案与地面确实参考进行比较,并分配指示正确性的二进制奖励 ...
0 0 0 2025/07/14 arXiv:2507.08794v1 树叶无声
估计个人对不同治疗剂量的潜在反应对于精确医学和管理科学等领域的决策至关重要。最新的研究通过学习与治疗变量无关的协变量表示,预测了反事实结果。但是,这种独立性约束忽略了许多对反事实预测有用的协变量信息,尤其是在处理变量是连续的时 ...
0 0 0 2025/07/14 arXiv:2403.14232v1 RRdec
因果关系的不确定性量化对于安全至关重要的应用(例如个性化医学)至关重要。一个有力的方法是保形预测,由于模型不合稳定样本的保证,该预测具有几个实际的好处。然而,现有的因果效应保形预测的方法仅限于二进制/离散治疗,并做出高度限制性的假设,例如已知的倾向得分 ...
0 0 0 2025/07/14 arXiv:2407.03094v3 RRdec
尽管最近的在线高清映射方法可减轻负担负担的离线管道和求解新鲜度,但它们仍然受到感知不准确性的限制,狭窄的流量闭塞以及无法融合多代理观察结果。我们提出RTMAP来通过将多回味高清图作为自我进化的记忆来增强这些单渗流方法。在机上代理,RTMAP同时以端到端的方式解决了三个核心挑战:(1)HD MAP元素的不确定性意识到的位置建模,(2)概率可以意识到的本地化w ...
0 0 0 2025/07/14 arXiv:2507.00980v1 longgangganggang
开源视觉语言模型(VLM)(例如Llava,Qwen-VL和Llama)的最新进展已促进了对与各种系统的整合的广泛研究。这些模型中封装的互联网规模的通用知识为增强自动驾驶感知,预测和计划功能提供了重要的机会。在本文中,我们提出了一种视觉自动驾驶模型VLAD,该模型将微调的VLM与VAD(VAD)集成在一起,VAD是一个最先进的端到端系统 ...
0 0 0 2025/07/14 arXiv:2507.01284v1 longgangganggang
可以检测到图像中不可见但在相机附近不可见的对象吗?这项研究介绍了2D,2.5D和3D未观察到的对象检测的新任务,以预测附近物体的位置被遮挡或位于图像框架之外。我们调整了几个最先进的预训练的生成模型来解决此任务,包括2D和3D扩散模型和视觉模型,并证明它们可用于推断未直接观察到的对象的存在 ...
0 0 0 2025/07/14 arXiv:2410.05869v4 argbunint256

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)