Hydra-MDP ++介绍了一个新颖的教师知识蒸馏框架,该框架具有多头解码器,该解码器从人类示范和基于规则的专家中学习。该框架使用轻巧的Resnet-34网络,并结合了扩展的评估指标,包括交通信号灯合规性(TL),巷道维护能力(LK)和扩展舒适度(EC),以解决传统NAVSIM衍生老师未捕获的不安全行为。像其他端到端自动驾驶方法一样,\ hydra直接处理原始图像,而无需依赖特权的感知信号 ...
基于学习的决策有可能实现可概括的自动驾驶(AD)政策,从而减少了基于规则的方法的工程开销。模仿学习(IL)仍然是主要的范式,受益于大规模的人类示范数据集,但它具有固有的局限性,例如分布变化和模仿差距。强化学习(RL)提出了一种有希望的选择,但由于缺乏标准化和有效的研究框架,其在AD中的采用仍然有限 ...
在这项工作中,我们旨在使用具有一组参数的单个加固学习代理来解决大量任务。一个关键的挑战是处理增加的数据和延长培训时间。我们已经开发了一种新的分布式代理Impala(重要的加权演员学习者体系结构),该架构不仅在单机器训练中更有效地使用资源,而且在不牺牲数据效率或资源利用率的情况下将其扩展到数千台机器 ...
自主驾驶的现代方法在很大程度上依赖于通过模仿学习训练大量人类驾驶数据的学习组件。但是,这些方法需要大量昂贵的数据收集,即使随着时间的流逝,可以安全处理长尾方案和复合错误,即使随后面临挑战。同时,纯钢筋学习(RL)方法可能无法以稀疏,约束且具有挑战性的奖励设置(例如自动驾驶)学习性能政策 ...
在本文中,我们介绍了CAPS(上下文感知的优先采样),这是一种新颖的方法,旨在提高基于学习的自主驾驶系统的数据效率。 CAPS通过利用Vector量化的变异自动编码器(VQ-VAE)来应对模仿学习中不平衡训练数据集的挑战。 VQ-VAE的使用提供了一个结构化且可解释的数据表示,这有助于揭示数据中有意义的模式 ...
由于难以学习最佳驾驶政策,因此具有复杂多代理动力学的自主城市驾驶导航尚未探索。传统的模块化管道在很大程度上依赖于手工设计的规则和预处理的感知系统,而受监督的基于学习的模型受到广泛的人类经验的可及性的限制。我们提出了一种通用和原则可控的模仿增强学习(CIRL)方法,该方法成功地使驱动剂基于高保真汽车模拟器中的视力输入而获得更高的成功率 ...
自主驾驶(AD)代理会根据在线感知结果产生驾驶政策,这些驾驶政策是在多个级别的抽象中获得的,例如行为计划,运动计划和控制 ...
在基础模型快速扩展的时代,自动驾驶技术正在接近一个变革性的门槛,端到端自动驾驶(E2E-AD)因其以数据驱动方式扩展的潜力而应运而生。然而,现有的E2E-AD方法大多在开环日志重播方式下进行评估,以L2错误和冲突率作为指标(例如 ...
视觉模仿学习方法表明了强劲的性能,但是当面对视觉输入扰动时,它们缺乏概括,包括照明和纹理的变化,阻碍了他们的真实应用。我们提出了使用预处理的图像扩散模型来抑制低级视觉差异的同时,同时维持高级场景结构。此图像反转过程类似于将观察值转换为共享表示,从中进行了其他观察结果,并消除了无关的细节 ...
轨迹预测和计划是自动驾驶汽车在动态环境中安全有效导航的基本组件。传统上,这些组件通常被视为单独的模块,从而限制了执行互动计划的能力并导致多代理场景中的计算效率低下。在本文中,我们提出了一个新颖的统一和数据驱动的框架,该框架将预测和计划与单个一致性模型集成在一起 ...