本文提出了一种消除动态驾驶场景中移动物体影响的激光雷达惯性里程计(LIO)方法。该方法为当前扫描的3D点构建二值化标签,并利用地图中每个点与其周围点之间的标签差异来识别移动物体。首先,二值化标签,即 ...
0 0 0 2024/10/22 arXiv:2407.03590v2 lucian_p
基于表格的推理在将深度模型与离散推理相结合方面取得了显着进展,这需要对自由形式自然语言(NL)问题和结构化表格数据进行推理。然而,以前的基于表的推理解决方案通常会因大量证据(表)而导致性能显着下降。此外,大多数现有方法很难推理复杂的问题,因为所需的信息分散在不同的地方 ...
0 0 0 2024/10/22 arXiv:2301.13808v3 wuhuijuan
在自然语言处理领域,对表格数据的理解永远是学术探究的焦点。以 ChatGPT 等为代表的扩展语言模型的出现引发了一波研究浪潮,研究人员旨在利用这些模型来完成与基于表格的问答相关的任务。我们研究的核心是阐明方法,这些方法可以增强此类大型语言模型在辨别表格的结构复杂性和内在内容方面的能力,最终促进它们对相关查询提供明智响应的能力 ...
0 0 0 2024/10/22 arXiv:2308.11891v2 wuhuijuan
面向任意的对象检测是涉及航空图像和场景文本的视觉场景中的一项基本任务。在本报告中,我们提出了 PP-YOLOE-R,一种基于 PP-YOLOE 的高效无锚旋转目标检测器。我们在 PP-YOLOE-R 中引入了一系列有用的技巧,以通过边际额外参数和计算成本来提高检测精度 ...
0 0 0 2024/10/22 arXiv:2211.02386v1 lexpool
大型语言模型(LLM)已被证明能够执行各种任务,但它们解释和推理表格的能力仍然是一个尚未充分开发的领域。在此背景下,本研究从三个核心角度进行研究:LLM对表格中结构扰动的结构性、表格上文本和符号推理的比较分析,以及通过聚合多种推理路径来提升模型性能的潜力。我们发现,表达相同内容的表格的结构差异表明性能显着着下降,特别是是在符号推理任务中... ...
0 0 0 2024/10/22 arXiv:2312.16702v1 Fairy
我们研究如何将基于网络规模数据训练的视觉语言模型(VLM)集成到端到端驾驶系统中,以提高泛化能力并实现与人类用户的交互。虽然最近的方法使 VLM 能够通过单轮视觉问答 (VQA) 进行驾驶,但人类驾驶员会通过多个步骤来推理决策。从关键物体的定位开始,人类在采取行动之前估计物体的相互作用 ...
0 0 0 2024/10/22 arXiv:2312.14150v2 zbx
闭环仿真对于推进端到端自动驾驶系统至关重要。 NeRF 和 3DGS 等当代传感器模拟方法主要依赖于与训练数据分布密切相关的条件,而这些条件在很大程度上仅限于前向驾驶场景。因此,这些方法在渲染复杂的机动时面临局限性(例如 ...
0 0 0 2024/10/22 arXiv:2410.13571v2 kangcci
我们提出了 LangProp,一个用于在监督学习和强化学习环境中迭代优化大型语言模型 (LLM) 生成的代码的框架。虽然 LLM 可以零样本生成合理的编码解决方案,但它们通常不是最优的。特别是对于代码生成任务,初始代码很可能在某些边缘情况下失败 ...
0 0 0 2024/10/22 arXiv:2401.10314v2 zbx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)