Equivariant Diffusion Policy¶
📌 一句话:把任务里的对称性(SO(2) 等变)直接编进扩散策略网络,6-DoF 控制下样本效率更高——仿真基准成功率比基线高约 22%,真机少量数据也能学好。 🎬 项目页 · 代码 · 论文 ⚠️ 摘要级占位卡:基于摘要/项目页,未精读全文。
🧰 对我们(速判)¶
- "几何归纳偏置 → 扩散策略"代表:当数据贵时,用对称性换样本效率是高性价比一招;和 卡片-3D-DiffusionPolicy 都属"给扩散策略加结构先验"。
- 真实性:高(CoRL 2024 Oral + 开源 + Robert Platt 组)→ 证据 A。
- 能借:✅ 代码;等变网络模块可移植到我们的策略骨干。
关键(摘要级)¶
- 在扩散行为克隆里引入域对称性,利用 6-DoF 任务的 SO(2) 等变性质。📄
- 仿真基准成功率较基线约 +21.9%;真机少量演示即可学到有效策略。📄
- 作者 Dian Wang, Robin Walters, Robert Platt 等(东北大学 + Boston Dynamics AI Institute)。
与我们的关系¶
- 与 卡片-DiffusionPolicy 同源;与 卡片-3D-DiffusionPolicy 一样走"给扩散策略加先验/结构"的提效路线。
来源¶
- 📄 Equivariant Diffusion Policy, arXiv 2407.01812(CoRL 2024 Oral)· 项目页 · 代码