跳转至

机器人知识库

Diffusion Policy —— 把动作生成建成条件去噪扩散（视觉运动策略奠基作）

Diffusion Policy（视觉运动策略奠基作）¶

📌 一句话：把机器人动作序列生成建模为条件去噪扩散过程——天然吃下多模态动作分布、适配高维动作空间、训练稳定；12 个操作任务平均超 SOTA 约 47%。 🎬 项目页 · 代码 · 论文 🔬 全文精读 + 关键图 + 数字：详读-DiffusionPolicy ⚠️ 摘要级占位卡：基于摘要/项目页，未精读全文。

🧰 对我们（速判）¶

几乎所有后续视觉运动策略的"母本"：DP3、Consistency Policy、Equivariant DP、ReactiveDiffusionPolicy 都从它派生——读这张是读懂整条扩散策略线的前提。
真实性：极高（RSS 2023 + 开源 + 被广泛复现）→ 证据 A。
能借：✅ 代码成熟；"动作序列 + 去噪扩散 + receding horizon"范式可直接作我们策略层基线。

关键（摘要级）¶

用条件去噪扩散生成动作（而非单点回归），三大优势：表达多模态、可扩到高维动作、训练稳定。📄
引入 receding-horizon 控制、视觉条件化、时序卷积等设计；12 个任务平均 +46.9% over 此前 SOTA。📄
作者 Cheng Chi, Zhenjia Xu, Shuran Song 等（哥大/TRI/MIT）。

与我们的关系¶

是卡片-3D-DiffusionPolicy、卡片-ConsistencyPolicy、卡片-EquivariantDiffusionPolicy、卡片-ReactiveDiffusionPolicy 的共同源头。

来源¶

📄 Diffusion Policy, arXiv 2303.04137（RSS 2023）· 项目页 · 代码