世界模型综述(理解世界 or 预测未来)¶
📌 一句话:把"世界模型"按两大功能切开——① 建内部表征去理解世界机制、② 预测未来状态来模拟与指导决策;再按 4 个应用域展开:生成式游戏、自动驾驶、机器人、社会仿真。是 ACM CSUR 2025 的扩展版,机器人这条线正是我们关心的。
🧰 对我们(速判)¶
- 适合谁读:做"先预判未来再动作"(隐空间预测 / 视触觉联合预测)想找上位框架的人;想把 卡片-LaWAM、卡片-VT-WM、卡片-OmniVTA 放进大图里的人。
- 能当地图吗:✅ 能,尤其"理解 vs 预测"这条主轴能帮我们说清自己在做哪一类世界模型。
- 新旧:2024-11 首发、修订到 2025-12;跨域综述,机器人部分是其中一块而非全部,专攻触觉世界模型仍需配本库精读卡。
关键(摘要级)¶
- 📄 分类法:双功能轴(理解世界 / 预测未来)× 四应用域(生成式游戏 / 自动驾驶 / 机器人 / 社会仿真)。
- 📄 主要结论:世界模型是迈向 AGI 的关键一环,受多模态 LLM 与 Sora 类视频生成推动;不同域对"理解"与"预测"的侧重不同。
- 关联本库:机器人侧的隐空间预测代表见 卡片-LaWAM;视触觉联合预测见 卡片-VT-WM / 卡片-OmniVTA。