跳转至

NWM(导航世界模型)

📌 一句话:1B 条件扩散 Transformer,在第一视角视频上训练,按导航动作预测未来画面;熟悉环境里"模拟"轨迹、陌生环境里从单图"想象"路径来做规划。

🧰 对我们(速判)

  • 世界模型用于导航而非操作的代表:把"预测未来观测"直接接到轨迹规划上。
  • 真实性:高(Meta FAIR,LeCun 等)→ 证据 A。
  • 能借:动作条件视频生成 + 规划;偏导航域,与机器人操作场景需迁移。

关键(摘要级)

  • 📄 1B 参数条件扩散 Transformer,第一视角视频训练,按动作预测未来观测。
  • 📄 既可在已知环境仿真规划,也可凭单张图像在未知环境想象路径。

来源