MolmoAct(动作推理模型)¶
📌 一句话:Ai2 提出的"动作推理模型"(Action Reasoning Model)——在 Molmo 多模态模型基础上,让模型先在空间中做中间推理(如规划轨迹)再出动作,主打开源与可解释。
🧰 对我们(速判)¶
- 能借:✅ 开源(Ai2 一贯全开放权重/数据/代码,待核具体放出范围)。空间推理 + 动作的范式可借。
- 资源:基于 Molmo VLM;强调开放性,适合做二次研究。
- 证据:A(Ai2 + 官方博客 + arXiv)。
关键(摘要级)¶
- 📄 "Action Reasoning Model":先空间推理(中间表示/轨迹)后动作。
- 📄 出身 Molmo 多模态模型;定位开源、可复现(具体 benchmark 数字待核)。
来源¶
- 📄 MolmoAct: Action Reasoning Models that can Reason in Space, arXiv 2508.07917 · 官方博客
- 关联:卡片-ECoT(推理后动作路线) · 卡片-SpatialVLA · 概念-模型架构基础