跳转至

MolmoAct(动作推理模型)

📌 一句话:Ai2 提出的"动作推理模型"(Action Reasoning Model)——在 Molmo 多模态模型基础上,让模型先在空间中做中间推理(如规划轨迹)再出动作,主打开源与可解释。

🧰 对我们(速判)

  • 能借:✅ 开源(Ai2 一贯全开放权重/数据/代码,待核具体放出范围)。空间推理 + 动作的范式可借。
  • 资源:基于 Molmo VLM;强调开放性,适合做二次研究。
  • 证据:A(Ai2 + 官方博客 + arXiv)。

关键(摘要级)

  • 📄 "Action Reasoning Model":先空间推理(中间表示/轨迹)后动作。
  • 📄 出身 Molmo 多模态模型;定位开源、可复现(具体 benchmark 数字待核)。

来源