跳转至

Diffusion Policy(视觉运动策略奠基作)

📌 一句话:把机器人动作序列生成建模为条件去噪扩散过程——天然吃下多模态动作分布、适配高维动作空间、训练稳定;12 个操作任务平均超 SOTA 约 47%。 🎬 项目页 · 代码 · 论文 🔬 全文精读 + 关键图 + 数字详读-DiffusionPolicy ⚠️ 摘要级占位卡:基于摘要/项目页,未精读全文。

🧰 对我们(速判)

  • 几乎所有后续视觉运动策略的"母本":DP3、Consistency Policy、Equivariant DP、ReactiveDiffusionPolicy 都从它派生——读这张是读懂整条扩散策略线的前提。
  • 真实性:极高(RSS 2023 + 开源 + 被广泛复现)→ 证据 A。
  • 能借:✅ 代码成熟;"动作序列 + 去噪扩散 + receding horizon"范式可直接作我们策略层基线。

关键(摘要级)

  • 条件去噪扩散生成动作(而非单点回归),三大优势:表达多模态、可扩到高维动作、训练稳定。📄
  • 引入 receding-horizon 控制、视觉条件化、时序卷积等设计;12 个任务平均 +46.9% over 此前 SOTA。📄
  • 作者 Cheng Chi, Zhenjia Xu, Shuran Song 等(哥大/TRI/MIT)。

与我们的关系

来源