用于自主驾驶(AD)的大型视觉模型(VLM)正在发展超出感知和认知任务,以实现运动计划。但是,我们在这个方向上确定了两个关键的挑战:(1)VLM倾向于通过严重依靠历史记录输入信息来学习捷径,从而实现了看似强大的计划结果,而无需真正理解视觉输入; (2)经过思考的(COT)推理过程总是与运动计划成果不一致,以及如何有效利用复杂的推理能力来增强计划的能力,这在很大程度上仍未得到充满激励。在本文中,我们从小型域特异性VLM开始,并提出了驱动-R1,旨在桥接AD的方案推理和运动计划 ...

0 0 0 0 2025/07/04 arXiv:2506.18234v1 chenlei

许多机器学习算法的性能取决于其超参数设置。这项研究的目的是确定调整超参数是否重要,还是可以安全地将其设置为默认值。我们提出了一种方法,以确定基于非效率测试和调整风险的高参数调整高参数的重要性:当未调整超参数时会产生的性能损失,而是设置为默认值 ...

0 0 0 0 2025/06/07 arXiv:2007.07588v1 chenlei

我们提出了一种从单个图像中推断车辆的3D姿势和形状的方法。为了解决这个问题不足的问题,我们优化了生成的3D假设及其2D伪测量之间的两尺度投影一致性。具体而言,我们使用可变形的线框模型来生成媒介物形状和姿势的精细表示 ...

0 0 0 0 2025/06/07 arXiv:1901.03446v1 chenlei

自主驱动研究对运动计划者的最新进展,这些运动计划者坚固,安全和适应性。但是,现有的基于规则和数据驱动的计划者缺乏对长尾情景的适应性,而知识驱动的方法则提供了强大的推理,但在代表,控制和现实世界中的评估中面临挑战。为了应对这些挑战,我们提出了Lilodriver,这是一个终身学习框架,用于在长尾自动驾驶场景中进行闭环运动计划 ...

0 0 0 0 2025/05/28 arXiv:2505.17209v1 chenlei

我们描述了一种自主驾驶的强大规划方法,该方法通过训练运动预测的扩散模型来混合正常和对抗性剂预测输出。我们首先训练一个扩散模型,以学习正常剂行为的公正分布。然后,我们通过在测试时间偏向扩散模型来产生对抗性预测的分布,以产生可能与候选计划相撞的预测 ...

0 0 0 0 2025/05/23 arXiv:2505.12327v1 chenlei

随着自主驾驶技术的持续成熟和应用,对开源自动驾驶数据集进行系统的检查在促进行业生态系统的强大发展方面发挥了重要作用。当前的自动驾驶数据集可以广泛地分为两代。第一代自主驾驶数据集的特征是相对简单的传感器模式,较小的数据量表,并且仅限于感知级的任务 ...

0 0 0 0 2025/05/22 arXiv:2312.03408v4 chenlei

端到端的自主驾驶框架能够无缝地集成感知和计划,但通常依赖于单发轨迹预测,这可能会导致不稳定的控制和脆弱性在单帧感知中闭塞。为了解决这个问题,我们提出了动量吸引驾驶(MOMAD)框架,该框架引入了轨迹动量和感知动量,以稳定和完善轨迹预测。 MOMAD包括两个核心组成部分:(1)拓扑轨迹匹配(TTM)采用Hausdorff距离来选择与先前路径保持一致的最佳计划查询以确保相干性;(2)动量计划交互器(MPI)交叉互动可与所选的计划查询与历史质量相关,以扩展静态和动态感知文件 ...

0 0 0 0 2025/05/22 arXiv:2503.03125v3 chenlei

模仿学习的最新进展是通过策略体系结构来扩展到复杂的视觉运动任务,多模式分布和大型数据集的。但是,这些方法通常依赖于大量专家演示中的学习。为了解决这些缺点,我们提出了潜在扩散计划(LDP),该计划是由计划器组成的模块化方法,该方法可以利用无动作的演示,以及一个可以利用次优数据的逆动力学模型,两者都可以在学习的潜在空间上运行 ...

0 0 0 0 2025/05/22 arXiv:2504.16925v1 chenlei

我们介绍了Nocturne,这是一种新的2D驾驶模拟器,用于研究部分可观察性下的多代理协调。夜曲的重点是在现实世界多代理设置中对推理和心理理论进行研究,而没有计算机视觉的计算开销并从图像中提取特征。该模拟器中的代理只会观察到场景的障碍,模仿人类的视觉传感限制 ...

0 0 0 0 2025/05/21 arXiv:2206.09889v3 chenlei

随机人类运动预测(HMP)通常已经通过生成的对抗网络和变异自动编码器来解决。大多数先前的作品旨在根据骨架关节的分散来预测高度多样化的运动。这导致了预测快速和运动发散运动的方法,这些运动通常与过去的运动不切实际且不连贯 ...

0 0 0 0 2025/05/20 arXiv:2211.14304v3 chenlei

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)