产业地图 · 世界模型 / 隐空间路线(谁在投这条线)¶
🔗 技术背景先读 概念-隐空间与潜动作学习。本页是它的产业侧:把"世界模型/隐空间/潜动作"当叙事的公司按派别+融资铺开。 ⚠️ 全页融资金额=媒体/官方口径,非精确;证据档:✅有据(权威源/多源一致) · 🔶推断 · 🟡存疑(单弱源/洽谈中/自评口径)。"洽谈中"不等于已到账,已分别标注。这是公开信息的整理,不构成投资建议。
0. 一句话结论¶
"世界模型"是三条赛道共用的一面旗,钱最多的旗手不在人形机器人,而在:① 驾驶世界模型(Wayve/Waabi)、② 生成式 3D/视频世界模型(World Labs/Decart/Odyssey/Runway)、③ 两位学术领袖的新公司——李飞飞 World Labs(生成式 3D,累计 ~$12亿) 与 LeCun AMI Labs(非生成式 JEPA 隐空间,$10.3亿种子)。二者分别代表"生成像素 vs 隐空间预测"两条对立路线,是这条线最根本的路线之争。钱主要投给了生成式;LeCun 的 JEPA 是唯一拿到十亿级、押反向路线的异类。
1. 概念澄清(画地图必读·防同名不同物)¶
- 隐空间世界模型 = 大伞:在学到的隐空间预测未来而非原始像素。下分两支、内涵相反:
- 生成式/重建式(Sora/Genie/World Labs/Decart/Runway):隐空间由重建损失产生,终点仍是生成像素。拿走绝大部分钱。
- 非生成式 JEPA(LeCun→V-JEPA→AMI Labs):只预测缺失部分的表征、不画像素,快、适合"想象多动作"做规划。唯一大额押反向路线者。
- 潜动作(Latent Action, LAM) = 更具体的零件:逆动力学从相邻帧反推"隐动作"让世界模型可控。无纯创业赛道——DeepMind(Genie)出生、NVIDIA(GR00T)商业化;创业侧最接近的是 Rhoda AI(DVA) 和 1X(1XWM 的 IDM)。
2. 生成式 / 3D / 视频世界模型派(内容与仿真,非操作机器人)¶
- World Labs(李飞飞)✅真核心:空间智能/Large World Model,产品 Marble(文图视频→可导航持久 3D 世界)。累计 ~$12.3亿(2024-09 $230M@~$1B a16z→2026-02 新一轮 $1B,NVIDIA/AMD/Autodesk/Fidelity);~$5B 估值"洽谈中"🟡。研究模型 RTFM。
- Decart(以色列)✅真核心:实时动作条件世界模型(Oasis/Mirage),主打零延迟。累计 >$4.5亿(2026-05 $300M@~$4B,NVIDIA 参投);天使含 Karpathy。
- Odyssey(前 Cruise/Wayve)✅真核心:生成式可交互世界(因果自回归,每帧由过去帧+动作生成)。2026-06 Series B $310M@$1.45B;与 AWS 战略合作。
- Runway 🔶视频转向:视频生成龙头,2025 底打 General World Models(GWM-1)旗号。2026-02 Series E $315M@$5.3B。
- Luma AI 🔶叙事升级:2025-11 Series C $900M@>$4B(沙特 HUMAIN 领投),稿件写"加速 Large World Models",但交付仍是视频生成🟡。
- (排除:Higgsfield/Pika — 消费短视频生成,无世界模型叙事。)
3. 自动驾驶 / 仿真世界模型派(旗舰级 WM,但非人形操作)¶
- Wayve(GAIA)✅真核心·论文最硬:端到端具身驾驶,GAIA 世界模型做生成式仿真。累计 ~$26亿(2026-02 Series D $1.2B(+Uber 至~$1.5B)@$8.6B)。论文 GAIA-1(arXiv 2309.17080)、GAIA-2(arXiv 2503.20523,潜在扩散+多视角)。
- Waabi(Raquel Urtasun)✅真核心·WM 中心性最高:整司围绕 Waabi World(生成式神经仿真器),几乎全仿真训练。2026-01 Series C $750M(+Uber ~$250M)。技术底 UniSim(arXiv 2308.01898)。
- 极佳视界 / GigaAI(黄冠,前地平线)✅叙事最激进/🟡口径存疑:自称"全球首家世界模型公司",DriveDreamer(有真论文)+GigaWorld/GigaBrain(多为自评榜"全球第一"🟡)。融资密集(A2~2亿、Pre-B 近10亿、B2 10亿元)。"全球第一/首个"宣传需高度打折。
- Helm.ai 🔶:视觉优先 ADAS+生成式仿真(WorldGen-1)。Series C $55M;与 Honda 合作。无旗舰 arXiv🟡。
4. 具身 / 机器人操作派(关键区分:真·世界模型 vs VLA 阵营)¶
⭐ 真把世界模型/潜动作当核心叙事的只有: - AMI Labs(LeCun)✅✅隐空间路线十亿级旗舰:2025-11 离 Meta 创立,全押 JEPA 非生成式隐空间世界模型(反 LLM)。2026-03 种子轮 $1.03B@$3.5B 投前(欧洲史上最大种子,Bezos Expeditions/NVIDIA/Samsung/Toyota 等)。承诺大量开源。血统 = Meta V-JEPA2。整条线唯一押"非生成式 JEPA"的大额融资。 - 1X Technologies(NEO)✅✅分量在升:自研 1X World Model(从数千小时 EVE 视频学的虚拟仿真器),2024 定位策略评测→2026-01 升级直接当 NEO 策略(text-conditioned diffusion 生成未来帧 + IDM 抽动作)。累计 ~$1.37亿;Series C 计划募 up to $1B@≥$10B 洽谈中未 close🟡。诚实点:NEO 家务现仍需遥操作。 - Dexterity(Foresight)✅✅反直觉最强叙事:2026 推 Foresight"物理约束型世界模型",明确反对生成式世界模型(批其"无因果、无物理接地"),强调因果+物理+可回滚。累计 ~$3亿(2025-03 $95M@$1.65B)。仓储/卡车装卸落地。 - Rhoda AI ✅最接近"从视频学潜动作"纯玩家:专有 Direct Video Action(DVA),互联网视频预训练→少量机器人数据映射成动作。2026-03 隐身退出,Series A $450M@~$1.7B(Khosla/Temasek)。品牌叫 DVA 非"latent action"🔶;无公开论文🟡。
❌ VLA/基础模型阵营(融资更大,但世界模型≠核心叙事,列此防误标): - Physical Intelligence(π0):VLA+flow matching,生成的是动作不是未来观测。$600M@$5.6B(2025-11)。arXiv π0 2410.24164/π0.5 2504.16054。 - Figure AI(Helix):明确 VLA(S0/S1/S2 双系统),官方页零处"world model"。$1B+@$39B。 - Skild AI:统一机器人基础模型,世界模型仅作训练工具(用 NVIDIA Cosmos)。$1.4B@$14B。 - Generalist AI(GEN-0/1):主页明写押"超越 VLA 和世界模型",核心是真实灵巧数据 scaling。$400M@$2B。
5. 中国相关¶
- 生数科技 Shengshu ✅叙事最扎实之一:清华朱军团队,Vidu 起家→升级"通用世界模型"(数字侧 WGM/Vidu + 物理侧 WAM→统一产品 Motus,2025-12 开源)。B 轮近20亿元(阿里云领投)。有开源+顶尖学术血统。
- 无界动力 / Boundless Dynamics ✅核心叙事/🟡口径存疑:最贴"隐空间路线"定义的中国具身公司——明确以"隐空间世界模型 MWA™ + RL"为核心、刻意区别 VLA。详见 追踪-无界动力。融资累计"~$2亿级"(人民币/美元口径混乱🟡);无公开论文、能力靠宣称🟡。
- 极佳视界 GigaAI:见 §3(同时做驾驶+具身)。
- 星海图 Galbot 🔶组件非主叙事:世界模型 Fast-WAM 是差异化模块,主叙事仍 VLA+本体。B+ 轮20亿元@估值破200亿(高瓴)。(与"银河通用 Galbot"不同公司,勿混。)
- 光轮智能 🔶卖铲人:Physical AI 合成数据/仿真(供 NVIDIA/Figure/1X),不产出世界模型本身。~10亿元(蚂蚁领投)。
- 群核科技 🔶相邻:空间智能(SpatialLM 开源),2026 港股上市。
6. 大厂/实验室(非可投资,但"叙事血统"来源)¶
- DeepMind:Genie 3(实时交互世界模型)+SIMA 2+Dreamer 系;Genie 是 latent action 的学术出处(Genie 1=2402.15391)。
- Meta:V-JEPA/V-JEPA2(2506.09985),LeCun 主张的隐空间预测、非生成式。LeCun 离职后内部延续性存疑🔶。
- OpenAI:Sora——官方定位《Video generation models as world simulators》,像素/生成式(与 JEPA 对立)。
- NVIDIA:Cosmos(2501.03575)+GR00T N1(2503.14734,把学术潜动作 LAPA 商业化)。既是资本方(投遍全谱)又是卖铲人——这条线的隐形庄家。
7. 对比表(按估值/融资量级,混合派别)¶
| 公司 | 融资/估值(口径) | 世界模型主张 | 真核心? | 派别 |
|---|---|---|---|---|
| Figure AI | $1B+ @ $39B✅ | Helix=VLA | ❌ | 人形 VLA |
| Skild AI | $1.4B @ $14B✅ | 基础模型 | ❌ | 具身基础模型 |
| World Labs | 累计 ~$12.3亿✅ | 空间智能/LWM | ✅ | 生成式 3D(李飞飞) |
| Wayve | ~$1.5B @ $8.6B✅ | GAIA | ✅ | AV 世界模型 |
| Physical Intelligence | $600M @ $5.6B✅ | π0=VLA | ❌ | 具身 VLA |
| Runway | $315M @ $5.3B✅ | GWM-1 | 🔶 | 视频→WM |
| Decart | $300M @ $4B✅ | 实时交互 WM | ✅ | 生成式视频 |
| AMI Labs | $1.03B 种子@$3.5B✅ | JEPA 隐空间 | ✅ | 非生成式(LeCun) |
| Waabi | $750M(+Uber)✅ | Waabi World | ✅ | AV 世界模型 |
| Rhoda AI | $450M @ ~$1.7B✅ | DVA 视频→动作 | ✅ | 具身/潜动作邻域 |
| Dexterity | $95M @ $1.65B✅ | Foresight(物理约束) | ✅ | 具身(反生成式) |
| Odyssey | $310M @ $1.45B✅ | 通用交互世界 | ✅ | 生成式视频 |
| 生数科技 | B轮近20亿元✅ | WGM/WAM/Motus | ✅ | 生成→通用WM(清华) |
| 1X | ~$1.37亿✅(C轮$1B洽谈🟡) | 1XWM(评测→策略) | ✅✅ | 人形世界模型 |
| 无界动力 | 天使系列~$2亿级🟡 | 隐空间WM+RL | ✅ | 具身隐空间(中国) |
8. 总结:谁领跑,钱投给哪种叙事(🤖)¶
- 两极由两位学术领袖定义:李飞飞 World Labs(生成式 3D) vs LeCun AMI Labs(非生成式 JEPA 隐空间)——互为对立叙事,是路线之争的核心。
- 钱主要投给"生成式/像素空间世界模型"(Sora/Genie 血统 + 驾驶 Wayve/Waabi)。LeCun 的 JEPA 是唯一押反向路线的十亿级异类。
- 具身里"世界模型"最易被误标:融资最猛的 Figure/Skild/PI 都是 VLA 阵营;真把世界模型/潜动作当主线的具身创业公司只有 1X、Dexterity、Rhoda AI——都是中等融资的差异化押注者。
- "潜动作"没有纯创业赛道:DeepMind 出生、NVIDIA 商业化。
- NVIDIA 是隐形庄家:既投遍全谱,又用 Cosmos+GR00T 卖底座。
- 中国:生数科技(开源+清华血统)与无界动力(最贴隐空间定义)是叙事真核心两家;GigaAI 叙事最激进但"全球第一"多自评需打折。
9. 诚实标注(入库/对外前再核)¶
- 洽谈中·勿当既成事实🟡:1X Series C($1B/$10B)、PI 2026 传闻轮(~$1B/$11B)、World Labs ~$5B 估值。
- 中文融资口径混乱(GigaAI/无界动力/星海图,人民币/美元/轮次命名不一),正式引用前以单一权威源二次核。
- 未编造 arXiv:已核号见各条;Helix/Foresight/DYNA/GEN/Motubrain 等无 arXiv(公司博客);网传未核号未采用。
- 名称歧义已澄清:无界动力=张玉峰(前地平线)北京公司,非无问芯穹;星海图 Galbot≠银河通用 Galbot。
⚠️ 本页 🤖 整理、公开信息口径;是 watchlist 级情报,非尽调。金额/估值随时间变动,视为"截至 2026-07 的快照"。