arxiv AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning

名称
AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning
首页
https://yiyibooks.cn/arxiv/2503.07608v1/index.html
原始地址
https://arxiv.org/pdf/2503.07608
描述
Openai O1和DeepSeek R1在数学和科学等复杂领域中实现甚至超过了人类专家水平的表现,并通过强化学习(RL)和推理发挥了至关重要的作用。在自动驾驶中,最近的端到端模型具有大大改善的计划绩效,但由于有限的常识和推理能力,仍在努力解决长尾问题。一些研究将视觉模型(VLM)集成到自动驾驶中,但它们通常依靠预先训练的模型,并在驾驶数据上简单监督的微调(SFT),而无需进一步探索培训策略或专门针对计划的优化 ...