强化学习(RL)在解决自动驾驶决策和控制问题方面表现出优异的性能,越来越多地应用于各种驾驶场景。然而,驾驶是一个多属性问题,导致当前强化学习方法实现多目标兼容性面临挑战,特别是在策略执行和策略迭代方面。一方面,单一动作类型的共同动作空间结构限制了驾驶灵活性或导致政策执行过程中行为波动较大 ...
尽管自动驾驶技术取得了显着的进步,但由于推理能力有限,数据驱动的方法仍然难以应对复杂的场景。与此同时,随着视觉语言模型的普及,知识驱动的自动驾驶系统也取得了长足的发展。在本文中,我们提出了 LeapVAD,一种基于认知感知和双过程思维的新方法 ...
运动规划是自动驾驶的关键模块,其主要挑战是与其他参与者的交互造成的不确定性。由于大多数先前的方法将预测和规划视为单独的任务,因此很难对这些交互进行建模。此外,由于路线路径将自我车辆导航到预定义的目的地,因此它为自我车辆提供相对稳定的意图并有助于限制不确定性 ...
模拟真实的驾驶行为对于在复杂交通环境中开发和测试自主系统至关重要。同样重要的是控制模拟代理的行为以根据特定研究需求和安全考虑定制场景的能力。本文扩展了通用多智能体驾驶行为模型ITRA(Scibior等人 ...
近年来,车辆到一切通信辅助的自动驾驶 (V2X-AD) 取得了显着进步,实用通信 (PragComm) 成为车辆和其他 HTTP URL 之间实时协作的有前途的范例,广泛的研究已经在这项工作中,我们探讨了端到端驾驶中协作感知和决策之间的相互作用,我们重新审视了协作驾驶问题,并提出了 Select2Drive 框架来优化该 http URL 有限计算和通信的利用率,以减轻累积的影响延迟在感知和决策方面,Select2Drive通过制定主动预测范式引入分布式预测感知(DPP),并将高维语义特征预测简化为计算成本高效的运动感知重建。鉴于“少即是多”的原则,扩大感知视野可能会混淆决策模块而不是做出贡献,Select2Drive 利用基于重要区域的 PragComm (APC) 来优先考虑关键区域的通信,从而提高通信效率和决策效能。对 V2Xverse 数据集和 CARLA 驾驶模拟器的实证评估表明 Select2Drive 获得了 11 分 ...
流匹配 (FM) 是一个通用框架,用于通过常微分方程 (ODE) 定义概率路径,以在噪声和数据样本之间进行转换。最近的方法试图拉直这些流动轨迹,以生成具有较少功能评估的高质量样本,通常通过迭代校正方法或最佳传输解决方案。在本文中,我们介绍了一致性流匹配(Consistency-FM),这是一种新颖的 FM 方法,可以明确地强制速度场的自一致性 ...
生成至关重要但难以收集的安全关键场景提供了评估自动驾驶系统稳健性的有效方法。然而,场景的多样性和生成方法的效率受到安全关键场景的稀有性和结构的严重限制。因此,现有的仅根据观测数据估计分布的生成模型并不能令人满意地解决这个问题 ...
在本文中,我们确定了关键去噪模型的训练损失中奇点的来源,该来源导致去噪器的预测向源或目标分布的平均值崩溃。这种简并性会产生错误的吸引盆,扭曲去噪轨迹,并最终增加对这些模型进行采样所需的步骤数。我们通过利用某些去噪扩散和分数匹配模型提供的基于确定性 ODE 的采样器来规避此伪影,这些模型在源分布和目标分布之间建立了明确定义的变量变化 ...
扩散模型在许多应用中实现了最先进的生成质量,但它们捕获重尾分布中罕见或极端事件的能力仍不清楚。在这项工作中,我们表明具有标准高斯先验的传统扩散和流匹配模型无法捕获重尾行为。我们通过使用多元 Student-t 分布重新利用扩散框架进行重尾估计来解决这个问题 ...
真实且交互式的场景模拟是自动驾驶汽车(AV)开发的关键先决条件。在这项工作中,我们提出了 SceneDiffuser,这是一种为交通模拟而设计的场景级扩散先验。它提供了一个统一的框架,可以解决模拟的两个关键阶段:场景初始化(涉及生成初始流量布局)和场景推出(包括代理行为的闭环模拟) ...