AdaFlow(方差自适应流策略)¶
📌 一句话:用状态条件 ODE(流匹配)表示策略,再配一个方差自适应 ODE 求解器按动作分布的多模态程度动态调步数——单模态时退化成单步、快;多模态时多步、保多样性。 🎬 代码 · 论文 ⚠️ 摘要级占位卡:基于摘要,未精读全文。
🧰 对我们(速判)¶
- 流匹配策略 + 自适应加速代表:和 卡片-ConsistencyPolicy 同解"扩散/流策略推理慢",但走"按需调步"而非蒸馏;与已收的 卡片-π0(flow-based VLA)同属流匹配家族。
- 真实性:高(NeurIPS 2024 + 开源)→ 证据 A。
- 能借:✅ 代码;"用预测方差决定推理算力"思路可移植到我们的生成式策略。
关键(摘要级)¶
- 把策略建成状态条件 ODE(flow-based),解决扩散式模仿学习推理慢的问题。📄
- 方差自适应 ODE 求解器在推理时动态调步长:单模态自动退化为单步生成,快速且不牺牲多样性。📄
- 作者 Xixi Hu, Bo Liu, Xingchao Liu, Qiang Liu(UT Austin)。
与我们的关系¶
- 与 卡片-ConsistencyPolicy 共构"扩散/流策略提速"两路(自适应 ODE vs 蒸馏);流匹配底子与 卡片-π0 相通。
来源¶
- 📄 AdaFlow, arXiv 2402.04292(NeurIPS 2024)· 代码