跳转至

OpenVLA-OFT(优化微调配方)

📌 一句话:研究"怎么微调 VLA 更快更准"的配方(OFT = Optimized Fine-Tuning)——并行解码、连续动作、L1 回归目标等组合,在 LIBERO 上把 OpenVLA 成功率从 76.5% 提到 97.1%、吞吐提升约 26×。 🔬 全文精读 + 关键图 + 数字详读-OpenVLA-OFT

🧰 对我们(速判)

  • 能借:✅ 配方 + ✅ 代码。给 卡片-OpenVLA 这类底座做工程化落地(实时性 + 成功率)时的直接参考。
  • 资源:是微调技巧而非新底座,复用 OpenVLA 权重即可。
  • 证据:A(开源 + 有公开 benchmark 数字)。

关键(摘要级)

  • 📄 关键改动:并行解码 + 连续动作表示 + L1 回归目标(替代自回归离散 token)。
  • 📄 LIBERO 成功率 76.5% → 97.1%,吞吐 ~26×(论文公开数)。

来源