追踪 · Flexion「Reflect」¶
📌 一句话:瑞士苏黎世 Flexion 做的是人形机器人的"大脑/自主性软件栈"(autonomy stack)——不是机器人本体,硬件无关、跨任意机体部署(已知跑在 Unitree G1)。Reflect v1.0(2026-06)演示:人形收一条自然语言指令后自主走楼梯/乘电梯取包裹→拆箱→归置,全程无人接管。出身 ETH Zurich(ANYmal 组) + 前 NVIDIA,2025-11 拿 $50M A 轮(DST 领投,NVIDIA 风投跟投)。 🎬 追踪:flexion.ai · Reflect v1.0 发布页(内嵌 demo)
现状(到哪一步)✅已核¶
- Reflect v1.0(约 2026-06 发布):长时程(long-horizon)人形自主平台。demo——单条指令让人形自主走楼梯/乘电梯去取零食包裹、拆箱、把物品归置到货架抽屉,全程无人操作("everything is autonomous. No human operator is involved.")。第三方 theaiinsider.tech(2026-06-29)独立印证。
- 形态:软件,不是整机;强调 形态无关(morphology-agnostic),靠 OEM 合作伙伴落地。已知部署平台 = Unitree G1。
公司 / 路线 ✅已核¶
- Flexion Robotics AG,瑞士苏黎世(Affolternstrasse 42, 8050 Zurich);另设旧金山办公室。2024-12 注册 / 约 2025-01 运营。约 50+ 人。
- 脱胎于 ETH Zurich 机器人系统实验室(ANYmal 那个组) 多年研究 + Rudin 在 NVIDIA 的工作。
- 创始/核心团队:
- Nikita Rudin (CEO) — ETH 深度 RL 博士、前 NVIDIA。
- David Hoeller (CTO) — 前 NVIDIA,参与构建 Isaac Gym / Isaac Lab(GPU 并行 RL 仿真)。
- Julian Nubert(联合创始人,感知)、Fabian Tischhauser(硬件)。
- Marco Hutter(ETH 教授、RAI Institute 主任,ANYmal 之父)任顾问/联合创始人。
技术路线 ✅三层架构已核 / 🟡部分待验证¶
三层模块化(明确 VLA 路线,非端到端单体): 1. 顶层 Mission Control — 自研 VLM:自然语言任务理解、语义地图、持续重规划(反应式)。 2. 中层 Motion Layer — VLA 模型 + RL 技能库。⚠️训练数据口径在 v0→v1.0 间有变化:v0 期媒体称"主要合成数据",v1.0 官方页强调"真实世界数据"——🟡存疑。 3. 底层全身控制 "Reflex" — Transformer-based 低时延全身控制:平衡、力感知(force-aware)操控、执行器限位/安全。
🟡 公司自述、未进入交叉验证(待二次确认):自研运行时 FlexComm 号称比 ROS DDS 快 ~40%;内部 16 步任务 RL 把完成率 38%→90%;感知主用 egocentric(第一视角)相机。
触觉? ⚠️无证据说用了触觉传感器。"force-aware" 更可能是关节力/扭矩估计而非触觉皮肤——未确证,开放问题。 ❌ 别断言:被否决的说法"全栈只用 RL+仿真、完全不用遥操作/动捕"——有反证(运动层用到真实/含遥操作数据)。
融资 ✅已核¶
- 2025-11 A 轮 $50M(€43M),DST Global Partners 领投,NVentures(NVIDIA 风投) / redalpine / Prosus Ventures / Moonfire 跟投。
- 此前种子轮 $7.35M → 累计约 $57.35M。计划在旧金山湾区设美国总部。
论文 / 专利 / 视频 ⚠️信息缺口¶
- arXiv 论文:未检索到任何署名 "Flexion Robotics" 单位的论文。截至 2026-06,Flexion 尚未以公司名义发表研究。(不编号)
- 专利:未找到可核实专利号;官网/团队页无专利信号。
- demo 视频:未锁定确定归属官方的 YouTube;最可靠入口 = 官网 v1.0 发布页内嵌 demo。
🔎 反查通道:盯创始人的 Scholar/arXiv 单位变化(2026-06-30 已核)¶
思路(来自 ding 提议):公司未发论文时,追创始人的署名单位——单位一旦从 ETH/NVIDIA 变成 "Flexion Robotics",就是公司首篇论文的信号。 - Scholar 已挂 Flexion:✅ Julian Nubert 资料页写 "Perception at Flexion Robotics"(@flexion.ai 邮箱);✅ David Hoeller 在合作者标签里已标 Flexion。Nikita Rudin Scholar 抬头仍写 ETH RSL(@ethz.ch)。→ 盯这三人(+ Fabian Tischhauser)的下一篇,看单位是否变 Flexion。 - 创始人 2025 近作 = ETH/Isaac 收尾工作,非 Flexion 产出(真实可核 arXiv 号,代表技术底子): - Rudin: Parkour in the Wild(arXiv 2505.11164, 2025, IJRR;他自称"最后一篇博士工作");博士论文 Generalizing Agile Legged Locomotion with DRL(ETH, 2025)。另经典代表作 Learning to Walk in Minutes(CoRL 2021, 2109.11978)。 - Rudin+Hoeller+Hutter: RSL-RL: A Learning Library for Robotics Research(arXiv 2509.10771, 2025);Isaac Lab(GPU 仿真框架, 2025)。 - Nubert: Holistic Fusion(arXiv 2504.06479)、Boxi(arXiv 2504.18500, RSS2025)、连续时间状态估计综述(arXiv 2411.03951, T-RO)。 - 解读:这些是"RL+大规模并行仿真(Isaac/RSL-RL)+腿足全身控制+多模态状态估计"的血统,正好对上 Reflect 三层栈的底两层。但都不是 Flexion 论文;Hutter 作为顾问的 ETH 新作(如 GrandTour, arXiv 2602.18164, 2026-02)同理——只有 Hutter、无其他创始人,属 ETH RSL。 - 来源:dblp(Nikita Rudin) · Google Scholar(Rudin 1kKJYVIAAAAJ / Nubert kkirJKcAAAAJ) · Rudin 推文(2025-05,宣布离开 ETH 去 Flexion)。
💭 命名解读(🤖推测·未见官方解释,仅作线索)¶
- Flexion = 屈曲(生物力学/解剖学术语,关节弯曲,反义 extension 伸展)。对一家做关节式机体全身控制(四足→人形)的公司贴切;呼应其 ETH 腿足运动血统。
- Reflex vs Reflect 疑似故意双关,且映射架构:Reflex(反射)= 底层快速全身控制模块(本能、不假思索);Reflect(反思)= 顶层 VLM 持续重规划(想一想再动)。即"底层反射 + 顶层反思"的一快一慢双系统命名——与 卡片-Helix 等"System1/System2"叙事同构。
- ⚠️ 以上为命名联想,官方未证实,引用前别当作公司明示的设计意图。
🧬 技术栈推测(据创始人代表作反推 · 🔶推断)¶
Flexion 自己没发论文,但创始人的代表作就是公司技术栈的"化石"。下表把 Reflect 三层(+训练引擎)各自接到一篇已精读、可核实的创始人论文血统上。注:①论文=ETH/NVIDIA 时期成果,非 Flexion 产出;②"对应"是基于作者+方法+官方描述的🔶合理推断,非官方确认。
| Reflect 层 | 官方描述(公司自述) | 推断血统(已精读卡) | 创始人 |
|---|---|---|---|
| 顶层 Mission Control | 自研 VLM,自然语言任务/语义地图/持续重规划 | 🟡最弱血统:无对口论文(创业后新增能力);最近的迹象是 Holistic Fusion 提到的"自主登山用 VLM 规划器" | — |
| 中层 Motion Layer | VLA 模型 + RL 技能库,"general & extensible" | 卡片-ParkourInTheWild:多专家蒸馏→单网络→RL 微调,加地形即扩展技能(老技能不遗忘) | Rudin(CEO) |
| 底层 Reflex + 训练引擎 | Transformer 低时延全身控制 + 模块化技能 | 卡片-LearnToWalkInMinutes:数千并行环境+单GPU分钟级RL+sim2real(legged_gym/PPO→RSL-RL,Isaac Gym→Isaac Lab) | Rudin+Hoeller(CTO) |
| 感知 / 状态估计 | egocentric 相机为主(自述) | 卡片-HolisticFusion:任务/平台无关多模态因子图状态估计(IMU/GNSS/LiDAR/里程计) | Nubert(感知主管) |
推断出的 Flexion 技术栈画像(🔶): 1. 训练引擎是护城河底座:核心团队就是 Isaac Gym/Lab + RSL-RL 的原作者——"大规模并行 GPU 仿真 + RL"是他们最深的肌肉记忆,Reflect 的 RL 技能几乎必然跑在这套自研仿真/库上。 2. 运动层方法论已成型:Parkour 那套"专家分训 → 蒸馏成基础策略 → RL 微调 → 加地形扩展"是公开可得最接近 Reflect Motion Layer 的原型;区别只是把"地形技能"换成"操作/移动技能"、外面再套 VLA + VLM。 3. 从四足跨到人形:上述血统全在 ANYmal 四足上验证;Flexion 是把这套 sim-RL+全身控制+状态估计的方法论迁移到双足人形(Unitree G1),并在顶上新加 VLM/VLA——顶层(语言/VLA)是团队最新、最未经验证的一环,也是风险点。 4. 触觉?仍无证据:四条血统里没有一篇用触觉——Holistic Fusion 是本体/外感状态估计,Reflex 的 "force-aware" 更像关节力/扭矩(腿足全身控制传统),佐证"Reflect 大概率不用触觉皮肤"的判断(待 Flexion 自己澄清)。
与我们(landscape,中性)¶
- 跟我们最近的是它的技术血统:ETH ANYmal 的 RL + 全身控制那条线 + NVIDIA Isaac 仿真底子。这是"RL 训仿真技能 + VLA 运动层 + Transformer 全身控制"的软件大脑路线,和触觉×VLA 的纵线在"运动/操控层怎么落地"上有交集。
- 但它未出论文、纯公司自述,性能为营销口径,没有第三方独立基准。值得盯:是否出论文/技术报告、是否真用触觉、除 G1 外还有哪些 OEM。
来源(引用前核)¶
- 📄 官网 flexion.ai(about / Reflect v0 / v1.0) · LinkedIn(ch.linkedin.com/company/flexion-robotics) · Moneyhouse(Flexion Robotics AG 登记)。
- 📄 媒体:The Robot Report · Crunchbase News · EU-Startups · startupticker.ch · theaiinsider.tech(2026-06-29)。
- ⚠️ 技术细节多为公司自述/融资公关,按 🤖/👔 营销级证据对待,待论文或独立复现升级。