自主驾驶(AD)代理会根据在线感知结果产生驾驶政策,这些驾驶政策是在多个级别的抽象中获得的,例如行为计划,运动计划和控制 ...
在基础模型快速扩展的时代,自动驾驶技术正在接近一个变革性的门槛,端到端自动驾驶(E2E-AD)因其以数据驱动方式扩展的潜力而应运而生。然而,现有的E2E-AD方法大多在开环日志重播方式下进行评估,以L2错误和冲突率作为指标(例如 ...
视觉模仿学习方法表明了强劲的性能,但是当面对视觉输入扰动时,它们缺乏概括,包括照明和纹理的变化,阻碍了他们的真实应用。我们提出了使用预处理的图像扩散模型来抑制低级视觉差异的同时,同时维持高级场景结构。此图像反转过程类似于将观察值转换为共享表示,从中进行了其他观察结果,并消除了无关的细节 ...
轨迹预测和计划是自动驾驶汽车在动态环境中安全有效导航的基本组件。传统上,这些组件通常被视为单独的模块,从而限制了执行互动计划的能力并导致多代理场景中的计算效率低下。在本文中,我们提出了一个新颖的统一和数据驱动的框架,该框架将预测和计划与单个一致性模型集成在一起 ...
在复杂的开放世界环境中实现类似人类的驾驶行为是自主驾驶的关键挑战。由于适应能力有限和学习复杂的多模式行为,人们对人类计划中通常表现出的复杂多模式行为,而不是提及他们对他们对他们的强烈依赖,因此基于现代学习的计划方法(例如模仿学习方法)通常努力平衡竞争目标和缺乏安全保证带有预定义规则的后备策略。我们为闭环计划提出了一个新型的基于 Transformer 的扩散计划者,该计划可以有效地对多模式驾驶行为进行建模,并确保轨迹质量而无需任何基于规则的改进 ...
最近在自动驾驶方面的突破已经彻底改变了车辆对周围环境的看法和互动方式。特别是,世界模型已成为一项Linchpin技术,提供了整合多传感器数据,语义提示和时间动态的驱动环境的高保真表示。这样的模型统一了感知,预测和计划,从而使自主系统能够在复杂且通常是不可预测的条件下做出快速,明智的决定 ...
端到端驾驶系统取得了快速进展,但迄今为止尚未应用于具有挑战性的新CARLA排行榜2.0。此外,虽然有大量关于端到端架构和训练策略的文献,但训练数据集的影响常常被忽视 ...
自动驾驶需要安全的运动规划,尤其是在关键的“长尾”场景中。最近的端到端自动驾驶系统利用大型语言模型(LLM)作为规划器来提高对罕见事件的概括性。然而,在测试时使用 LLM 会带来很高的计算成本 ...
我们演示了一种计算分子振动能级的方法,该方法将分子哈密顿量的离散变量表示(DVR)与变分量子本征解算器(VQE)以及最佳量子门序列的贪婪搜索相结合。我们证明了 DVR 哈密顿量的结构将量子测量复杂度从指数级降低到多项式级,从而无需二次量化即可实现高效的 VQE。然后,我们证明 DVR 哈密顿量还可以产生非常有效的量子模拟,用于通过量子计算机的状态表示分子的旋转振动状态 ...
大型语言模型 (LLM) 能够处理文本、语音、图像和视频等多模式输入和输出,正在改变我们处理信息的方式。除了生成对提示的文本响应之外,它们还可以与不同的软件平台集成,以提供跨不同应用程序的全面解决方案。在本文中,我们介绍了 ChatSUMO,这是一种基于 LLM 的代理,它集成了语言处理技能,可在广泛使用的交通模拟器 - 城市移动模拟 (SUMO) 中生成抽象和真实世界的模拟场景 ...