chenlei的文档

chenlei

个性签名 ...

Waymo Open Dataset: Panoramic Video Panoptic Segmentation

Panoptic图像分割是计算机视觉任务，即在图像中查找像素的组，并为其分配语义类别和对象实例标识符。由于其在机器人技术和自动驾驶中的关键应用，图像细分的研究变得越来越流行。因此，研究社区依靠公开可用的基准数据集来推动计算机视觉中的最新技术 ...

0 0 0 0 2025/05/14 arXiv:2206.07704v1 chenlei

What Makes a Good Diffusion Planner for Decision Making?

扩散模型最近在解决决策问题方面表现出了巨大的潜力，尤其是在生成行为计划（也称为扩散计划）方面。尽管许多研究表明了扩散计划的令人印象深刻的表现，但良好扩散计划者的关键组成部分背后的机制尚不清楚，并且在现有研究中，设计选择非常不一致。在这项工作中，我们通过在离线增强学习（RL）设置中进行的系统经验实验来解决这个问题，从而提供了对扩散计划的基本组成部分的实用见解 ...

0 0 0 0 2025/05/14 arXiv:2503.00535v1 chenlei

DiffAD: A Unified Diffusion Modeling Approach for Autonomous Driving

端到端的自主驾驶（E2E-AD）已迅速成为实现完全自治的有前途的方法。但是，现有的E2E-AD系统通常采用传统的多任务框架，通过单独的特定任务负责人来解决感知，预测和计划任务。尽管接受了完全可区分的培训，但他们仍然会遇到任务协调的问题，并且系统的复杂性仍然很高 ...

0 0 0 0 2025/05/10 arXiv:2503.12170v1 chenlei

Diffusion Model Predictive Control

我们提出了扩散模型预测控制（D-MPC），这是一种新型的MPC方法，它使用扩散模型学习了多步操作建议和多步动力学模型，并将它们结合在一起用于在线MPC。在流行的D4RL基准测试中，我们显示的性能要比现有的基于模型的离线计划方法使用MPC明显好，并与最先进的ART（SOTA）基于模型和无模型的增强加固学习方法竞争。我们还说明了D-MPC在运行时优化新型奖励功能并适应新型动态的能力，并强调了其与现有基于扩散的计划基线相比的优势 ...

0 0 0 0 2025/05/07 arXiv:2410.05364v1 chenlei

IGDrivSim: A Benchmark for the Imitation Gap in Autonomous Driving

开发能够以人类水平的安全性和效率在复杂环境中行驶的自动驾驶汽车是自动驾驶研究的核心目标。实现这一目标的常见方法是模仿学习，即训练智能体模仿从现实世界驾驶场景中收集的人类专家演示。然而，人类感知和自动驾驶汽车传感器之间的差异可能会引入\textit{模仿差距}，导致模仿学习失败 ...

0 0 0 0 2025/04/17 arXiv:2411.04653v2 chenlei

Large Scale Interactive Motion Forecasting for Autonomous Driving : The Waymo Open Motion Dataset

随着自动驾驶系统的成熟，运动预测已受到越来越多的关注，这是计划的关键要求。特别重要的是交互式情况，例如合并，未保护的转弯等，在这些情况下，预测单个对象运动不足 ...

0 0 0 0 2025/04/17 arXiv:2104.10133v1 chenlei

Hydra-MDP++: Advancing End-to-End Driving via Expert-Guided Hydra-Distillation

Hydra-MDP ++介绍了一个新颖的教师知识蒸馏框架，该框架具有多头解码器，该解码器从人类示范和基于规则的专家中学习。该框架使用轻巧的Resnet-34网络，并结合了扩展的评估指标，包括交通信号灯合规性（TL），巷道维护能力（LK）和扩展舒适度（EC），以解决传统NAVSIM衍生老师未捕获的不安全行为。像其他端到端自动驾驶方法一样，\ hydra直接处理原始图像，而无需依赖特权的感知信号 ...

0 0 0 0 2025/03/22 arXiv:2503.12820v1 chenlei

V-Max: Making RL practical for Autonomous Driving

基于学习的决策有可能实现可概括的自动驾驶（AD）政策，从而减少了基于规则的方法的工程开销。模仿学习（IL）仍然是主要的范式，受益于大规模的人类示范数据集，但它具有固有的局限性，例如分布变化和模仿差距。强化学习（RL）提出了一种有希望的选择，但由于缺乏标准化和有效的研究框架，其在AD中的采用仍然有限 ...

0 0 0 0 2025/03/18 arXiv:2503.08388v1 chenlei

IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures

在这项工作中，我们旨在使用具有一组参数的单个加固学习代理来解决大量任务。一个关键的挑战是处理增加的数据和延长培训时间。我们已经开发了一种新的分布式代理Impala（重要的加权演员学习者体系结构），该架构不仅在单机器训练中更有效地使用资源，而且在不牺牲数据效率或资源利用率的情况下将其扩展到数千台机器 ...

0 0 0 0 2025/03/18 arXiv:1802.01561v3 chenlei

CIMRL: Combining IMitation and Reinforcement Learning for Safe Autonomous Driving

自主驾驶的现代方法在很大程度上依赖于通过模仿学习训练大量人类驾驶数据的学习组件。但是，这些方法需要大量昂贵的数据收集，即使随着时间的流逝，可以安全处理长尾方案和复合错误，即使随后面临挑战。同时，纯钢筋学习（RL）方法可能无法以稀疏，约束且具有挑战性的奖励设置（例如自动驾驶）学习性能政策 ...

0 0 0 0 2025/03/14 arXiv:2406.08878v4 chenlei