强化学习(RL)可以表述为序列建模问题,其中模型根据历史状态-动作-奖励序列预测未来的动作。当前的方法通常需要长轨迹序列来对离线 RL 设置中的环境进行建模。然而,这些模型往往过度依赖记忆长期表征,这削弱了它们根据特定任务相关性有效赋予轨迹和学习表征重要性的能力 ...
自动驾驶汽车越来越依赖深度神经网络来实现类人驾驶。然而,这种黑匣子运动规划器的不透明性使得驾驶员很难准确预测它们何时会失败,并可能带来灾难性的后果。在这里,我们介绍概念包装网络(i. ...
复杂场景下多智能体的轨迹预测对于自动驾驶等应用至关重要。然而,现有方法常常忽视环境偏差,导致泛化能力较差。此外,硬件限制限制了跨环境大规模数据的使用,而持续的学习设置加剧了灾难性遗忘的挑战 ...
准确预测周围交通参与者可行的多模式未来轨迹的能力对于自动驾驶车辆的行为规划至关重要。运动变换器 (MTR) 是一种最先进的运动预测方法,通过用一小组固定的先验运动意图点替换传统的密集未来端点,减轻了训练期间的模式崩溃和不稳定性,并增强了整体预测性能。然而,固定的先验意图点使得MTR多模态预测分布过于分散,在许多场景下不可行 ...
模型预测控制 (MPC) 是一种强大的、基于优化的控制动力系统的方法。然而,在线优化的计算复杂性在嵌入式设备上可能会出现问题。特别是当我们需要保证固定的控制频率时 ...
轨迹规划涉及生成一系列在不久的将来要遵循的空间点。然而,由于驾驶环境的复杂性和不确定性,自动驾驶汽车(AV)详尽地设计规划规则来优化未来轨迹是不切实际的。为了解决这个问题,我们提出了一种称为速度场的局部地图表示方法 ...
在自动驾驶中,运动预测旨在预测附近智能体的未来轨迹,帮助自我车辆预测行为并安全驾驶。一个关键的挑战是生成多样化的未来预测,通常使用具有多项选择学习 (MCL) 架构和赢家通吃 (WTA) 训练目标的数据驱动模型来解决。然而,这些方法面临初始化敏感性和训练不稳定性 ...
为了实现安全的自动驾驶(AD),我们考虑了学习模型的问题,该模型能够在与自动驾驶车辆交互时准确捕获人类驾驶员行为概率分布的多样性和尾分位数。此类模型可以根据驾驶员的状态预测其连续行为,对于缩小自动驾驶智能体模拟与现实之间的差距特别重要。为此,我们针对此设置采用了两个灵活的分位数学习框架,以避免强分布假设:(1)分位数回归(基于标题绝对损失)和(2)自回归分位数流(标准化流的一种版本) ...
运动预测是自动驾驶中的一项关键任务,其主要挑战之一在于未来行为的多模态性。许多成功的工作都利用了需要识别正混合成分的混合模型,相应地分为两条主线:基于预测的匹配和基于锚的匹配。基于预测的匹配中的预测聚类现象使得很难为下游任务选择代表性轨迹,而基于锚的匹配则受到回归能力有限的影响 ...
当前的端到端自动驾驶方法诉诸于针对各种任务(例如感知、预测和规划)的统一模块化设计 ...