arxiv Developing Trajectory Planning with Behavioral Cloning and Proximal Policy Optimization for Path-Tracking and Static Obstacle Nudging

名称
Developing Trajectory Planning with Behavioral Cloning and Proximal Policy Optimization for Path-Tracking and Static Obstacle Nudging
首页
https://yiyibooks.cn/arxiv/2409.05289v1/index.html
原始地址
https://arxiv.org/pdf/arXiv:2409.05289
描述
强化学习(RL)和模仿学习(IL)的端到端方法在自动驾驶领域越来越受欢迎。然而,它们不像经典的机器人工作流程那样涉及明确的推理,也不涉及视野规划,领导策略隐含且短视。在本文中,我们介绍了我们的轨迹规划方法,该方法使用行为克隆(BC)进行路径跟踪,并使用 BC 引导的近端策略优化(PPO)进行静态障碍物微调 ...