跳转至

机器人知识库

世界模型综述 —— "理解世界 vs 预测未来"两大功能的全景（含机器人域）

世界模型综述（理解世界 or 预测未来）¶

📌 一句话：把"世界模型"按两大功能切开——① 建内部表征去理解世界机制、② 预测未来状态来模拟与指导决策；再按 4 个应用域展开：生成式游戏、自动驾驶、机器人、社会仿真。是 ACM CSUR 2025 的扩展版，机器人这条线正是我们关心的。

🧰 对我们（速判）¶

适合谁读：做"先预判未来再动作"（隐空间预测 / 视触觉联合预测）想找上位框架的人；想把卡片-LaWAM、卡片-VT-WM、卡片-OmniVTA 放进大图里的人。
能当地图吗：✅ 能，尤其"理解 vs 预测"这条主轴能帮我们说清自己在做哪一类世界模型。
新旧：2024-11 首发、修订到 2025-12；跨域综述，机器人部分是其中一块而非全部，专攻触觉世界模型仍需配本库精读卡。

关键（摘要级）¶

📄 分类法：双功能轴（理解世界 / 预测未来）× 四应用域（生成式游戏 / 自动驾驶 / 机器人 / 社会仿真）。
📄 主要结论：世界模型是迈向 AGI 的关键一环，受多模态 LLM 与 Sora 类视频生成推动；不同域对"理解"与"预测"的侧重不同。
关联本库：机器人侧的隐空间预测代表见卡片-LaWAM；视触觉联合预测见卡片-VT-WM / 卡片-OmniVTA。

来源¶

📄 Understanding World or Predicting Future? A Comprehensive Survey of World Models, arXiv 2411.14499（ACM CSUR 2025 扩展版）