跳转至

产业地图 · 世界模型 / 隐空间路线(谁在投这条线)

🔗 技术背景先读 概念-隐空间与潜动作学习。本页是它的产业侧:把"世界模型/隐空间/潜动作"当叙事的公司按派别+融资铺开。 ⚠️ 全页融资金额=媒体/官方口径,非精确;证据档:✅有据(权威源/多源一致) · 🔶推断 · 🟡存疑(单弱源/洽谈中/自评口径)。"洽谈中"不等于已到账,已分别标注。这是公开信息的整理,不构成投资建议。

0. 一句话结论

"世界模型"是三条赛道共用的一面旗,钱最多的旗手不在人形机器人,而在:① 驾驶世界模型(Wayve/Waabi)、② 生成式 3D/视频世界模型(World Labs/Decart/Odyssey/Runway)、③ 两位学术领袖的新公司——李飞飞 World Labs(生成式 3D,累计 ~$12亿) 与 LeCun AMI Labs(非生成式 JEPA 隐空间,$10.3亿种子)。二者分别代表"生成像素 vs 隐空间预测"两条对立路线,是这条线最根本的路线之争。钱主要投给了生成式;LeCun 的 JEPA 是唯一拿到十亿级、押反向路线的异类。

1. 概念澄清(画地图必读·防同名不同物)

  • 隐空间世界模型 = 大伞:在学到的隐空间预测未来而非原始像素。下分两支、内涵相反:
  • 生成式/重建式(Sora/Genie/World Labs/Decart/Runway):隐空间由重建损失产生,终点仍是生成像素。拿走绝大部分钱。
  • 非生成式 JEPA(LeCun→V-JEPA→AMI Labs):只预测缺失部分的表征、不画像素,快、适合"想象多动作"做规划。唯一大额押反向路线者。
  • 潜动作(Latent Action, LAM) = 更具体的零件:逆动力学从相邻帧反推"隐动作"让世界模型可控。无纯创业赛道——DeepMind(Genie)出生、NVIDIA(GR00T)商业化;创业侧最接近的是 Rhoda AI(DVA) 和 1X(1XWM 的 IDM)。

2. 生成式 / 3D / 视频世界模型派(内容与仿真,非操作机器人)

  • World Labs(李飞飞)✅真核心:空间智能/Large World Model,产品 Marble(文图视频→可导航持久 3D 世界)。累计 ~$12.3亿(2024-09 $230M@~$1B a16z→2026-02 新一轮 $1B,NVIDIA/AMD/Autodesk/Fidelity);~$5B 估值"洽谈中"🟡。研究模型 RTFM。
  • Decart(以色列)✅真核心:实时动作条件世界模型(Oasis/Mirage),主打零延迟。累计 >$4.5亿(2026-05 $300M@~$4B,NVIDIA 参投);天使含 Karpathy。
  • Odyssey(前 Cruise/Wayve)✅真核心:生成式可交互世界(因果自回归,每帧由过去帧+动作生成)。2026-06 Series B $310M@$1.45B;与 AWS 战略合作。
  • Runway 🔶视频转向:视频生成龙头,2025 底打 General World Models(GWM-1)旗号。2026-02 Series E $315M@$5.3B
  • Luma AI 🔶叙事升级:2025-11 Series C $900M@>$4B(沙特 HUMAIN 领投),稿件写"加速 Large World Models",但交付仍是视频生成🟡。
  • 排除:Higgsfield/Pika — 消费短视频生成,无世界模型叙事。)

3. 自动驾驶 / 仿真世界模型派(旗舰级 WM,但非人形操作)

  • Wayve(GAIA)✅真核心·论文最硬:端到端具身驾驶,GAIA 世界模型做生成式仿真。累计 ~$26亿(2026-02 Series D $1.2B(+Uber 至~$1.5B)@$8.6B)。论文 GAIA-1(arXiv 2309.17080)、GAIA-2(arXiv 2503.20523,潜在扩散+多视角)
  • Waabi(Raquel Urtasun)✅真核心·WM 中心性最高:整司围绕 Waabi World(生成式神经仿真器),几乎全仿真训练。2026-01 Series C $750M(+Uber ~$250M)。技术底 UniSim(arXiv 2308.01898)。
  • 极佳视界 / GigaAI(黄冠,前地平线)✅叙事最激进/🟡口径存疑:自称"全球首家世界模型公司",DriveDreamer(有真论文)+GigaWorld/GigaBrain(多为自评榜"全球第一"🟡)。融资密集(A2~2亿、Pre-B 近10亿、B2 10亿元)。"全球第一/首个"宣传需高度打折。
  • Helm.ai 🔶:视觉优先 ADAS+生成式仿真(WorldGen-1)。Series C $55M;与 Honda 合作。无旗舰 arXiv🟡。

4. 具身 / 机器人操作派(关键区分:真·世界模型 vs VLA 阵营)

⭐ 真把世界模型/潜动作当核心叙事的只有: - AMI Labs(LeCun)✅✅隐空间路线十亿级旗舰:2025-11 离 Meta 创立,全押 JEPA 非生成式隐空间世界模型(反 LLM)。2026-03 种子轮 $1.03B@$3.5B 投前(欧洲史上最大种子,Bezos Expeditions/NVIDIA/Samsung/Toyota 等)。承诺大量开源。血统 = Meta V-JEPA2整条线唯一押"非生成式 JEPA"的大额融资。 - 1X Technologies(NEO)✅✅分量在升:自研 1X World Model(从数千小时 EVE 视频学的虚拟仿真器),2024 定位策略评测→2026-01 升级直接当 NEO 策略(text-conditioned diffusion 生成未来帧 + IDM 抽动作)。累计 ~$1.37亿;Series C 计划募 up to $1B@≥$10B 洽谈中未 close🟡。诚实点:NEO 家务现仍需遥操作。 - Dexterity(Foresight)✅✅反直觉最强叙事:2026 推 Foresight"物理约束型世界模型",明确反对生成式世界模型(批其"无因果、无物理接地"),强调因果+物理+可回滚。累计 ~$3亿(2025-03 $95M@$1.65B)。仓储/卡车装卸落地。 - Rhoda AI ✅最接近"从视频学潜动作"纯玩家:专有 Direct Video Action(DVA),互联网视频预训练→少量机器人数据映射成动作。2026-03 隐身退出,Series A $450M@~$1.7B(Khosla/Temasek)。品牌叫 DVA 非"latent action"🔶;无公开论文🟡。

❌ VLA/基础模型阵营(融资更大,但世界模型≠核心叙事,列此防误标): - Physical Intelligence(π0):VLA+flow matching,生成的是动作不是未来观测。$600M@$5.6B(2025-11)。arXiv π0 2410.24164/π0.5 2504.16054。 - Figure AI(Helix):明确 VLA(S0/S1/S2 双系统),官方页零处"world model"。$1B+@$39B。 - Skild AI:统一机器人基础模型,世界模型仅作训练工具(用 NVIDIA Cosmos)。$1.4B@$14B。 - Generalist AI(GEN-0/1):主页明写押"超越 VLA 和世界模型",核心是真实灵巧数据 scaling。$400M@$2B。

5. 中国相关

  • 生数科技 Shengshu ✅叙事最扎实之一:清华朱军团队,Vidu 起家→升级"通用世界模型"(数字侧 WGM/Vidu + 物理侧 WAM→统一产品 Motus,2025-12 开源)。B 轮近20亿元(阿里云领投)。有开源+顶尖学术血统。
  • 无界动力 / Boundless Dynamics ✅核心叙事/🟡口径存疑最贴"隐空间路线"定义的中国具身公司——明确以"隐空间世界模型 MWA™ + RL"为核心、刻意区别 VLA。详见 追踪-无界动力。融资累计"~$2亿级"(人民币/美元口径混乱🟡);无公开论文、能力靠宣称🟡。
  • 极佳视界 GigaAI:见 §3(同时做驾驶+具身)。
  • 星海图 Galbot 🔶组件非主叙事:世界模型 Fast-WAM 是差异化模块,主叙事仍 VLA+本体。B+ 轮20亿元@估值破200亿(高瓴)。(与"银河通用 Galbot"不同公司,勿混。)
  • 光轮智能 🔶卖铲人:Physical AI 合成数据/仿真(供 NVIDIA/Figure/1X),不产出世界模型本身。~10亿元(蚂蚁领投)。
  • 群核科技 🔶相邻:空间智能(SpatialLM 开源),2026 港股上市。

6. 大厂/实验室(非可投资,但"叙事血统"来源)

  • DeepMind:Genie 3(实时交互世界模型)+SIMA 2+Dreamer 系;Genie 是 latent action 的学术出处(Genie 1=2402.15391)。
  • MetaV-JEPA/V-JEPA2(2506.09985),LeCun 主张的隐空间预测、非生成式。LeCun 离职后内部延续性存疑🔶。
  • OpenAI:Sora——官方定位《Video generation models as world simulators》,像素/生成式(与 JEPA 对立)。
  • NVIDIA:Cosmos(2501.03575)+GR00T N1(2503.14734,把学术潜动作 LAPA 商业化)。既是资本方(投遍全谱)又是卖铲人——这条线的隐形庄家。

7. 对比表(按估值/融资量级,混合派别)

公司 融资/估值(口径) 世界模型主张 真核心? 派别
Figure AI $1B+ @ $39B Helix=VLA 人形 VLA
Skild AI $1.4B @ $14B 基础模型 具身基础模型
World Labs 累计 ~$12.3亿 空间智能/LWM 生成式 3D(李飞飞)
Wayve ~$1.5B @ $8.6B GAIA AV 世界模型
Physical Intelligence $600M @ $5.6B π0=VLA 具身 VLA
Runway $315M @ $5.3B✅ GWM-1 🔶 视频→WM
Decart $300M @ $4B 实时交互 WM 生成式视频
AMI Labs $1.03B 种子@$3.5B✅ JEPA 隐空间 非生成式(LeCun)
Waabi $750M(+Uber)✅ Waabi World AV 世界模型
Rhoda AI $450M @ ~$1.7B✅ DVA 视频→动作 具身/潜动作邻域
Dexterity $95M @ $1.65B✅ Foresight(物理约束) 具身(反生成式)
Odyssey $310M @ $1.45B✅ 通用交互世界 生成式视频
生数科技 B轮近20亿元✅ WGM/WAM/Motus 生成→通用WM(清华)
1X ~$1.37亿✅(C轮$1B洽谈🟡) 1XWM(评测→策略) ✅✅ 人形世界模型
无界动力 天使系列~$2亿级🟡 隐空间WM+RL 具身隐空间(中国)

8. 总结:谁领跑,钱投给哪种叙事(🤖)

  1. 两极由两位学术领袖定义:李飞飞 World Labs(生成式 3D) vs LeCun AMI Labs(非生成式 JEPA 隐空间)——互为对立叙事,是路线之争的核心。
  2. 钱主要投给"生成式/像素空间世界模型"(Sora/Genie 血统 + 驾驶 Wayve/Waabi)。LeCun 的 JEPA 是唯一押反向路线的十亿级异类。
  3. 具身里"世界模型"最易被误标:融资最猛的 Figure/Skild/PI 都是 VLA 阵营;真把世界模型/潜动作当主线的具身创业公司只有 1X、Dexterity、Rhoda AI——都是中等融资的差异化押注者。
  4. "潜动作"没有纯创业赛道:DeepMind 出生、NVIDIA 商业化。
  5. NVIDIA 是隐形庄家:既投遍全谱,又用 Cosmos+GR00T 卖底座。
  6. 中国:生数科技(开源+清华血统)与无界动力(最贴隐空间定义)是叙事真核心两家;GigaAI 叙事最激进但"全球第一"多自评需打折。

9. 诚实标注(入库/对外前再核)

  • 洽谈中·勿当既成事实🟡:1X Series C($1B/$10B)、PI 2026 传闻轮(~$1B/$11B)、World Labs ~$5B 估值。
  • 中文融资口径混乱(GigaAI/无界动力/星海图,人民币/美元/轮次命名不一),正式引用前以单一权威源二次核。
  • 未编造 arXiv:已核号见各条;Helix/Foresight/DYNA/GEN/Motubrain 等无 arXiv(公司博客);网传未核号未采用。
  • 名称歧义已澄清:无界动力=张玉峰(前地平线)北京公司,非无问芯穹;星海图 Galbot≠银河通用 Galbot。

⚠️ 本页 🤖 整理、公开信息口径;是 watchlist 级情报,非尽调。金额/估值随时间变动,视为"截至 2026-07 的快照"。