基本信息

文件基本信息

名称

FlowPolicy: Enabling Fast and Robust 3D Flow-based Policy via Consistency Flow Matching for Robot Manipulation

首页

https://yiyibooks.cn/arxiv/2412.04987v2/index.html

原始地址

https://arxiv.org/pdf/2412.04987

描述

机器人可以通过专家演示学习策略来获得复杂的操作技能，这通常被称为基于视觉的模仿学习。基于扩散和流量匹配模型的生成策略已被证明是有效的，特别是在机器人操作任务中。然而，基于递归的方法在从噪声分布到策略分布的工作中推理效率低下，在效率和质量之间提出了具有挑战性的权衡。这促使我们提出 FlowPolicy，这是一种基于一致性流匹配和 3D 视觉的快速策略生成的新颖框架。我们的方法通过标准化速度场的自洽性来细化流动动力学，使模型能够在单个推理步骤中导出任务执行策略。具体来说，在观察到的3D点云上的FlowPolicy条件，其中一致性流匹配直接定义从不同时间状态到同一动作空间的直线流，同时约束它们的速度值，即通过规范动作空间内速度场的自一致性来近似从噪声到机器人动作的轨迹，从而提高推理效率。我们在 Adroit 和 Metaworld 中验证了 FlowPolicy 的有效性，证明与最先进的方法相比，推理速度提高了 7 倍\倍，同时保持了有竞争力的平均成功率。代码可从此 https URL 获取 ...