chenlei的文档

chenlei

个性签名 ...

NEAT: Neural Attention Fields for End-to-End Autonomous Driving

对场景的语义、空间和时间结构的有效推理是自动驾驶的重要先决条件。我们提出了神经注意力场（NEAT），这是一种新颖的表示形式，可以实现端到端模仿学习模型的推理。 NEAT 是一个连续函数，它将鸟瞰 (BEV) 场景坐标中的位置映射到路点和语义，使用中间注意力图迭代地将高维 2D 图像特征压缩为紧凑的表示 ...

0 0 0 0 2024/08/17 arXiv:2109.04456v1 chenlei

Reinforcement Learning Applications

我们首先简要介绍强化学习 (RL)，包括它的成功故事、基础知识、示例、问题、ICML 2019 RL for Real Life 研讨会、如何使用它、学习材料和展望。然后我们讨论一系列 RL 应用，包括推荐系统、计算机系统、能源、金融、医疗保健、机器人和交通 ...

0 0 0 0 2024/08/17 arXiv:1908.06973v1 chenlei

ReasonNet: End-to-End Driving with Temporal and Global Reasoning

自动驾驶汽车的大规模部署尚未到来，剩下的主要挑战之一在于城市密集的交通场景。在这种情况下，预测场景的未来演变和物体的未来行为，以及处理罕见的不利事件（例如被遮挡物体的突然出现）仍然具有挑战性。在本文中，我们提出了 ReasonNet，这是一种新颖的端到端驾驶框架，它广泛利用驾驶场景的时间和全局信息 ...

0 0 0 0 2024/08/16 arXiv:2305.10507v1 chenlei

A Transformer-based Framework for Multivariate Time Series Representation Learning

在这项工作中，我们首次提出了一种基于 Transformer 的框架，用于多元时间序列的无监督表示学习。预训练模型可用于下游任务，例如回归和分类、预测和缺失值插补。通过在多元时间序列回归和分类的几个基准数据集上评估我们的模型，我们表明，我们的建模方法不仅代表了迄今为止采用多元时间序列无监督学习的最成功的方法，而且它超出了当前的状态 -监督方法的最先进的性能；即使训练样本的数量非常有限，它也能做到这一点，同时提供计算效率 ...

0 0 0 0 2024/08/13 arXiv:2010.02803v3 chenlei

Hidden Biases of End-to-End Driving Models

端到端驾驶系统最近取得了快速进展，特别是在 CARLA 上。独立于他们的主要贡献，他们对次要系统组件进行了更改。因此，改进的来源尚不清楚 ...

0 0 0 0 2024/08/13 arXiv:2306.07957v2 chenlei

A Survey on Model-based Reinforcement Learning

强化学习（rl）通过与环境交互的试错过程来解决顺序决策问题。虽然强化学习在玩允许大量试错的复杂视频游戏方面取得了巨大成功，但在现实世界中犯错误总是不受欢迎的。为了提高样本效率并减少错误，基于模型的强化学习（mbrl）被认为是一个有前途的方向，它构建了可以在没有实际成本的情况下进行试错的环境模型... ...

0 0 1 1 2025/05/09 arXiv:2206.09328v1 chenlei

End-To-End Planning of Autonomous Driving in Industry and Academia: 2022-2023

本文旨在对目前工业界和学术界报道的方法（包括详细技术）进行快速回顾。具体来说，本文回顾了端到端规划，包括 Tesla FSD V12、Momenta 2023、Horizon Robotics 2023、Motional RoboTaxi 2022、Woven Planet (Toyota): Urban Driver 和 Nvidia。此外，我们回顾了研究自动驾驶端到端规划的最先进的学术研究 ...

0 0 0 0 2024/08/09 arXiv:2401.08658v1 chenlei

Lane Change Decision-Making through Deep Reinforcement Learning

由于交通环境的复杂性和多变性，自动驾驶决策是一个非常困难的问题。在这个项目中，我们使用深度 Q 网络以及基于规则的约束来做出换道决策。通过将高层横向决策与低层基于规则的轨迹监控相结合，可以获得安全高效的车道变换行为 ...

0 0 0 0 2024/08/09 arXiv:2112.14705v1 chenlei

Deep Transformer Q-Networks for Partially Observable Reinforcement Learning

现实世界的强化学习任务通常涉及某种形式的部分可观察性，其中观察仅给出世界真实状态的部分或嘈杂视图。此类任务通常需要某种形式的记忆，其中代理可以访问多个过去的观察结果，以便良好地执行。整合记忆的一种流行方法是使用循环神经网络来访问代理的历史记录 ...

0 0 0 0 2024/08/08 arXiv:2206.01078v2 chenlei

Model-based Reinforcement Learning: A Survey

顺序决策，通常形式化为马尔可夫决策过程（MDP）优化，是人工智能中的一个重要挑战。解决这个问题的两个关键方法是强化学习（RL）和规划。本文对这两个领域的整合进行了调查，即基于模型的强化学习 ...

0 0 0 0 2024/08/08 arXiv:2006.16712v4 chenlei