跳转至

世界模型综述(理解世界 or 预测未来)

📌 一句话:把"世界模型"按两大功能切开——① 建内部表征去理解世界机制、② 预测未来状态来模拟与指导决策;再按 4 个应用域展开:生成式游戏、自动驾驶、机器人、社会仿真。是 ACM CSUR 2025 的扩展版,机器人这条线正是我们关心的。

🧰 对我们(速判)

  • 适合谁读:做"先预判未来再动作"(隐空间预测 / 视触觉联合预测)想找上位框架的人;想把 卡片-LaWAM卡片-VT-WM卡片-OmniVTA 放进大图里的人。
  • 能当地图吗:✅ 能,尤其"理解 vs 预测"这条主轴能帮我们说清自己在做哪一类世界模型。
  • 新旧:2024-11 首发、修订到 2025-12;跨域综述,机器人部分是其中一块而非全部,专攻触觉世界模型仍需配本库精读卡。

关键(摘要级)

  • 📄 分类法:双功能轴(理解世界 / 预测未来)× 四应用域(生成式游戏 / 自动驾驶 / 机器人 / 社会仿真)。
  • 📄 主要结论:世界模型是迈向 AGI 的关键一环,受多模态 LLM 与 Sora 类视频生成推动;不同域对"理解"与"预测"的侧重不同。
  • 关联本库:机器人侧的隐空间预测代表见 卡片-LaWAM;视触觉联合预测见 卡片-VT-WM / 卡片-OmniVTA

来源