- 名称
- Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
- 描述
本文介绍了扩散策略,这是一种通过将机器人的视觉运动策略表示为条件去噪扩散过程来生成机器人行为的新方法。我们对来自 4 个不同机器人操作基准的 12 个不同任务的扩散策略进行了基准测试,发现它始终优于现有最先进的机器人学习方法,平均提高了 46.9%。扩散策略学习动作分布得分函数的梯度,并在推理过程中通过一系列随机朗之万动力学步骤对该梯度场进行迭代优化。我们发现扩散公式在用于机器人策略时具有强大的优势,包括优雅地处理多模态动作分布、适用于高维动作空间以及表现出令人印象深刻的训练稳定性。为了充分释放扩散模型在物理机器人视觉运动策略学习中的潜力,本文提出了一系列关键技术贡献,包括结合后退地平线控制、视觉调节和时间序列扩散 Transformer 。我们希望这项工作将有助于激发新一代政策学习技术,这些技术能够利用扩散模型强大的生成建模功能。代码、数据和培训详细信息可通过此 http URL 公开获取 ...