chenlei的文档

V-Max: Making RL practical for Autonomous Driving

基于学习的决策有可能实现可概括的自动驾驶（AD）政策，从而减少了基于规则的方法的工程开销。模仿学习（IL）仍然是主要的范式，受益于大规模的人类示范数据集，但它具有固有的局限性，例如分布变化和模仿差距。强化学习（RL）提出了一种有希望的选择，但由于缺乏标准化和有效的研究框架，其在AD中的采用仍然有限 ...

0 0 0 0 2025/03/18 arXiv:2503.08388v1 chenlei

IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures

在这项工作中，我们旨在使用具有一组参数的单个加固学习代理来解决大量任务。一个关键的挑战是处理增加的数据和延长培训时间。我们已经开发了一种新的分布式代理Impala（重要的加权演员学习者体系结构），该架构不仅在单机器训练中更有效地使用资源，而且在不牺牲数据效率或资源利用率的情况下将其扩展到数千台机器 ...

0 0 0 0 2025/03/18 arXiv:1802.01561v3 chenlei

CIMRL: Combining IMitation and Reinforcement Learning for Safe Autonomous Driving

自主驾驶的现代方法在很大程度上依赖于通过模仿学习训练大量人类驾驶数据的学习组件。但是，这些方法需要大量昂贵的数据收集，即使随着时间的流逝，可以安全处理长尾方案和复合错误，即使随后面临挑战。同时，纯钢筋学习（RL）方法可能无法以稀疏，约束且具有挑战性的奖励设置（例如自动驾驶）学习性能政策 ...

0 0 0 0 2025/03/14 arXiv:2406.08878v4 chenlei

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

在本文中，我们介绍了CAPS（上下文感知的优先采样），这是一种新颖的方法，旨在提高基于学习的自主驾驶系统的数据效率。 CAPS通过利用Vector量化的变异自动编码器（VQ-VAE）来应对模仿学习中不平衡训练数据集的挑战。 VQ-VAE的使用提供了一个结构化且可解释的数据表示，这有助于揭示数据中有意义的模式 ...

0 0 0 0 2025/03/14 arXiv:2503.01650v1 chenlei

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

由于难以学习最佳驾驶政策，因此具有复杂多代理动力学的自主城市驾驶导航尚未探索。传统的模块化管道在很大程度上依赖于手工设计的规则和预处理的感知系统，而受监督的基于学习的模型受到广泛的人类经验的可及性的限制。我们提出了一种通用和原则可控的模仿增强学习（CIRL）方法，该方法成功地使驱动剂基于高保真汽车模拟器中的视力输入而获得更高的成功率 ...

0 0 0 0 2025/03/13 arXiv:1807.03776v1 chenlei

A Survey of Deep RL and IL for Autonomous Driving Policy Learning

自主驾驶（AD）代理会根据在线感知结果产生驾驶政策，这些驾驶政策是在多个级别的抽象中获得的，例如行为计划，运动计划和控制 ...

0 0 0 0 2025/03/13 arXiv:2101.01993v1 chenlei

Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving

在基础模型快速扩展的时代，自动驾驶技术正在接近一个变革性的门槛，端到端自动驾驶（E2E-AD）因其以数据驱动方式扩展的潜力而应运而生。然而，现有的E2E-AD方法大多在开环日志重播方式下进行评估，以L2错误和冲突率作为指标（例如 ...

0 0 0 0 2025/03/07 arXiv:2406.03877v3 chenlei