Diffusion Policy(视觉运动策略奠基作)¶
📌 一句话:把机器人动作序列生成建模为条件去噪扩散过程——天然吃下多模态动作分布、适配高维动作空间、训练稳定;12 个操作任务平均超 SOTA 约 47%。 🎬 项目页 · 代码 · 论文 🔬 全文精读 + 关键图 + 数字:详读-DiffusionPolicy ⚠️ 摘要级占位卡:基于摘要/项目页,未精读全文。
🧰 对我们(速判)¶
- 几乎所有后续视觉运动策略的"母本":DP3、Consistency Policy、Equivariant DP、ReactiveDiffusionPolicy 都从它派生——读这张是读懂整条扩散策略线的前提。
- 真实性:极高(RSS 2023 + 开源 + 被广泛复现)→ 证据 A。
- 能借:✅ 代码成熟;"动作序列 + 去噪扩散 + receding horizon"范式可直接作我们策略层基线。
关键(摘要级)¶
- 用条件去噪扩散生成动作(而非单点回归),三大优势:表达多模态、可扩到高维动作、训练稳定。📄
- 引入 receding-horizon 控制、视觉条件化、时序卷积等设计;12 个任务平均 +46.9% over 此前 SOTA。📄
- 作者 Cheng Chi, Zhenjia Xu, Shuran Song 等(哥大/TRI/MIT)。
与我们的关系¶
- 是 卡片-3D-DiffusionPolicy、卡片-ConsistencyPolicy、卡片-EquivariantDiffusionPolicy、卡片-ReactiveDiffusionPolicy 的共同源头。
来源¶
- 📄 Diffusion Policy, arXiv 2303.04137(RSS 2023)· 项目页 · 代码