RoboVLMs(构建 VLA 的设计选择研究)¶
📌 一句话:系统性地问"造一个 VLA 时哪些设计选择真正重要"——跨多个 VLM 主干与策略架构做了 600+ 实验,给出一个少手工设计、刷到 SOTA 的 VLA 家族 RoboVLMs。 🔬 全文精读 + 关键图 + 数字:详读-RoboVLM
🧰 对我们(速判)¶
- 能借:✅ 方法论 + ✅ 代码。当作"选 VLM 主干 / 动作头 / 训练策略"的决策参考表,省自己盲试。
- 资源:偏研究性消融,结论可迁移到自建 VLA 的工程决策。
- 证据:A(开源 + 大规模公开实验)。
关键(摘要级)¶
- 📄 对比多种 VLM backbone × 策略架构(如不同动作头 / 历史融合方式)。
- 📄 产出 RoboVLMs 家族,强调"少手工设计、易复现"。