- 名称
- Developing Trajectory Planning with Behavioral Cloning and Proximal Policy Optimization for Path-Tracking and Static Obstacle Nudging
- 描述
强化学习(RL)和模仿学习(IL)的端到端方法在自动驾驶领域越来越受欢迎。然而,它们不像经典的机器人工作流程那样涉及明确的推理,也不涉及视野规划,领导策略隐含且短视。在本文中,我们介绍了我们的轨迹规划方法,该方法使用行为克隆(BC)进行路径跟踪,并使用 BC 引导的近端策略优化(PPO)进行静态障碍物微调 ...