跳转至

机器人知识库

Equivariant Diffusion Policy —— 把 SO(2) 对称性灌进扩散策略提样本效率

Equivariant Diffusion Policy¶

📌 一句话：把任务里的对称性（SO(2) 等变）直接编进扩散策略网络，6-DoF 控制下样本效率更高——仿真基准成功率比基线高约 22%，真机少量数据也能学好。 🎬 项目页 · 代码 · 论文 ⚠️ 摘要级占位卡：基于摘要/项目页，未精读全文。

🧰 对我们（速判）¶

"几何归纳偏置 → 扩散策略"代表：当数据贵时，用对称性换样本效率是高性价比一招；和卡片-3D-DiffusionPolicy 都属"给扩散策略加结构先验"。
真实性：高（CoRL 2024 Oral + 开源 + Robert Platt 组）→ 证据 A。
能借：✅ 代码；等变网络模块可移植到我们的策略骨干。

关键（摘要级）¶

在扩散行为克隆里引入域对称性，利用 6-DoF 任务的 SO(2) 等变性质。📄
仿真基准成功率较基线约 +21.9%；真机少量演示即可学到有效策略。📄
作者 Dian Wang, Robin Walters, Robert Platt 等（东北大学 + Boston Dynamics AI Institute）。

与我们的关系¶

与卡片-DiffusionPolicy 同源；与卡片-3D-DiffusionPolicy 一样走"给扩散策略加先验/结构"的提效路线。

来源¶

📄 Equivariant Diffusion Policy, arXiv 2407.01812（CoRL 2024 Oral）· 项目页 · 代码