追踪 · Flexion「Reflect」¶

📌 一句话：瑞士苏黎世 Flexion 做的是人形机器人的"大脑/自主性软件栈"(autonomy stack)——不是机器人本体，硬件无关、跨任意机体部署(已知跑在 Unitree G1)。Reflect v1.0(2026-06)演示:人形收一条自然语言指令后自主走楼梯/乘电梯取包裹→拆箱→归置，全程无人接管。出身 ETH Zurich(ANYmal 组) + 前 NVIDIA，2025-11 拿 $50M A 轮(DST 领投，NVIDIA 风投跟投)。 🎬 追踪：flexion.ai · Reflect v1.0 发布页(内嵌 demo)

现状（到哪一步）✅已核¶

Reflect v1.0(约 2026-06 发布)：长时程(long-horizon)人形自主平台。demo——单条指令让人形自主走楼梯/乘电梯去取零食包裹、拆箱、把物品归置到货架抽屉，全程无人操作("everything is autonomous. No human operator is involved.")。第三方 theaiinsider.tech(2026-06-29)独立印证。
形态：软件，不是整机；强调 形态无关(morphology-agnostic)，靠 OEM 合作伙伴落地。已知部署平台 = Unitree G1。

公司 / 路线 ✅已核¶

Flexion Robotics AG，瑞士苏黎世(Affolternstrasse 42, 8050 Zurich)；另设旧金山办公室。2024-12 注册 / 约 2025-01 运营。约 50+ 人。
脱胎于 ETH Zurich 机器人系统实验室(ANYmal 那个组) 多年研究 + Rudin 在 NVIDIA 的工作。
创始/核心团队：
Nikita Rudin (CEO) — ETH 深度 RL 博士、前 NVIDIA。
David Hoeller (CTO) — 前 NVIDIA，参与构建 Isaac Gym / Isaac Lab(GPU 并行 RL 仿真)。
Julian Nubert(联合创始人，感知)、Fabian Tischhauser(硬件)。
Marco Hutter(ETH 教授、RAI Institute 主任，ANYmal 之父)任顾问/联合创始人。

技术路线 ✅三层架构已核 / 🟡部分待验证¶

三层模块化(明确 VLA 路线，非端到端单体)： 1. 顶层 Mission Control — 自研 VLM：自然语言任务理解、语义地图、持续重规划(反应式)。 2. 中层 Motion Layer — VLA 模型 + RL 技能库。⚠️训练数据口径在 v0→v1.0 间有变化：v0 期媒体称"主要合成数据"，v1.0 官方页强调"真实世界数据"——🟡存疑。 3. 底层全身控制 "Reflex" — Transformer-based 低时延全身控制：平衡、力感知(force-aware)操控、执行器限位/安全。

🟡 公司自述、未进入交叉验证(待二次确认)：自研运行时 FlexComm 号称比 ROS DDS 快 ~40%；内部 16 步任务 RL 把完成率 38%→90%；感知主用 egocentric(第一视角)相机。

触觉？ ⚠️无证据说用了触觉传感器。"force-aware" 更可能是关节力/扭矩估计而非触觉皮肤——未确证，开放问题。 ❌ 别断言：被否决的说法"全栈只用 RL+仿真、完全不用遥操作/动捕"——有反证(运动层用到真实/含遥操作数据)。

融资 ✅已核¶

2025-11 A 轮 $50M(€43M)，DST Global Partners 领投，NVentures(NVIDIA 风投) / redalpine / Prosus Ventures / Moonfire 跟投。
此前种子轮 $7.35M → 累计约 $57.35M。计划在旧金山湾区设美国总部。

论文 / 专利 / 视频 ⚠️信息缺口¶

arXiv 论文：未检索到任何署名 "Flexion Robotics" 单位的论文。截至 2026-06，Flexion 尚未以公司名义发表研究。(不编号)
专利：未找到可核实专利号；官网/团队页无专利信号。
demo 视频：未锁定确定归属官方的 YouTube；最可靠入口 = 官网 v1.0 发布页内嵌 demo。

🔎 反查通道：盯创始人的 Scholar/arXiv 单位变化（2026-06-30 已核）¶

思路（来自 ding 提议）：公司未发论文时，追创始人的署名单位——单位一旦从 ETH/NVIDIA 变成 "Flexion Robotics"，就是公司首篇论文的信号。 - Scholar 已挂 Flexion：✅ Julian Nubert 资料页写 "Perception at Flexion Robotics"(@flexion.ai 邮箱)；✅ David Hoeller 在合作者标签里已标 Flexion。Nikita Rudin Scholar 抬头仍写 ETH RSL(@ethz.ch)。→ 盯这三人(+ Fabian Tischhauser)的下一篇,看单位是否变 Flexion。 - 创始人 2025 近作 = ETH/Isaac 收尾工作，非 Flexion 产出(真实可核 arXiv 号,代表技术底子)： - Rudin: Parkour in the Wild(arXiv 2505.11164, 2025, IJRR;他自称"最后一篇博士工作")；博士论文 Generalizing Agile Legged Locomotion with DRL(ETH, 2025)。另经典代表作 Learning to Walk in Minutes(CoRL 2021, 2109.11978)。 - Rudin+Hoeller+Hutter: RSL-RL: A Learning Library for Robotics Research(arXiv 2509.10771, 2025)；Isaac Lab(GPU 仿真框架, 2025)。 - Nubert: Holistic Fusion(arXiv 2504.06479)、Boxi(arXiv 2504.18500, RSS2025)、连续时间状态估计综述(arXiv 2411.03951, T-RO)。 - 解读：这些是"RL+大规模并行仿真(Isaac/RSL-RL)+腿足全身控制+多模态状态估计"的血统,正好对上 Reflect 三层栈的底两层。但都不是 Flexion 论文;Hutter 作为顾问的 ETH 新作(如 GrandTour, arXiv 2602.18164, 2026-02)同理——只有 Hutter、无其他创始人,属 ETH RSL。 - 来源：dblp(Nikita Rudin) · Google Scholar(Rudin 1kKJYVIAAAAJ / Nubert kkirJKcAAAAJ) · Rudin 推文(2025-05,宣布离开 ETH 去 Flexion)。

💭 命名解读（🤖推测·未见官方解释，仅作线索）¶

Flexion = 屈曲(生物力学/解剖学术语,关节弯曲,反义 extension 伸展)。对一家做关节式机体全身控制(四足→人形)的公司贴切;呼应其 ETH 腿足运动血统。
Reflex vs Reflect 疑似故意双关,且映射架构：Reflex(反射)= 底层快速全身控制模块(本能、不假思索);Reflect(反思)= 顶层 VLM 持续重规划(想一想再动)。即"底层反射 + 顶层反思"的一快一慢双系统命名——与卡片-Helix 等"System1/System2"叙事同构。
⚠️ 以上为命名联想,官方未证实,引用前别当作公司明示的设计意图。

🧬 技术栈推测（据创始人代表作反推 · 🔶推断）¶

Flexion 自己没发论文，但创始人的代表作就是公司技术栈的"化石"。下表把 Reflect 三层(+训练引擎)各自接到一篇已精读、可核实的创始人论文血统上。注：①论文=ETH/NVIDIA 时期成果，非 Flexion 产出；②"对应"是基于作者+方法+官方描述的🔶合理推断，非官方确认。

Reflect 层	官方描述(公司自述)	推断血统(已精读卡)	创始人
顶层 Mission Control	自研 VLM，自然语言任务/语义地图/持续重规划	🟡最弱血统：无对口论文(创业后新增能力)；最近的迹象是 Holistic Fusion 提到的"自主登山用 VLM 规划器"	—
中层 Motion Layer	VLA 模型 + RL 技能库，"general & extensible"	卡片-ParkourInTheWild：多专家蒸馏→单网络→RL 微调，加地形即扩展技能(老技能不遗忘)	Rudin(CEO)
底层 Reflex + 训练引擎	Transformer 低时延全身控制 + 模块化技能	卡片-LearnToWalkInMinutes：数千并行环境+单GPU分钟级RL+sim2real(legged_gym/PPO→RSL-RL，Isaac Gym→Isaac Lab)	Rudin+Hoeller(CTO)
感知 / 状态估计	egocentric 相机为主(自述)	卡片-HolisticFusion：任务/平台无关多模态因子图状态估计(IMU/GNSS/LiDAR/里程计)	Nubert(感知主管)

推断出的 Flexion 技术栈画像（🔶）： 1. 训练引擎是护城河底座：核心团队就是 Isaac Gym/Lab + RSL-RL 的原作者——"大规模并行 GPU 仿真 + RL"是他们最深的肌肉记忆，Reflect 的 RL 技能几乎必然跑在这套自研仿真/库上。 2. 运动层方法论已成型：Parkour 那套"专家分训 → 蒸馏成基础策略 → RL 微调 → 加地形扩展"是公开可得最接近 Reflect Motion Layer 的原型；区别只是把"地形技能"换成"操作/移动技能"、外面再套 VLA + VLM。 3. 从四足跨到人形：上述血统全在 ANYmal 四足上验证；Flexion 是把这套 sim-RL+全身控制+状态估计的方法论迁移到双足人形(Unitree G1)，并在顶上新加 VLM/VLA——顶层(语言/VLA)是团队最新、最未经验证的一环，也是风险点。 4. 触觉？仍无证据：四条血统里没有一篇用触觉——Holistic Fusion 是本体/外感状态估计，Reflex 的 "force-aware" 更像关节力/扭矩(腿足全身控制传统)，佐证"Reflect 大概率不用触觉皮肤"的判断(待 Flexion 自己澄清)。

与我们（landscape，中性）¶

跟我们最近的是它的技术血统：ETH ANYmal 的 RL + 全身控制那条线 + NVIDIA Isaac 仿真底子。这是"RL 训仿真技能 + VLA 运动层 + Transformer 全身控制"的软件大脑路线，和触觉×VLA 的纵线在"运动/操控层怎么落地"上有交集。
但它未出论文、纯公司自述，性能为营销口径，没有第三方独立基准。值得盯：是否出论文/技术报告、是否真用触觉、除 G1 外还有哪些 OEM。

来源（引用前核）¶

📄 官网 flexion.ai(about / Reflect v0 / v1.0) · LinkedIn(ch.linkedin.com/company/flexion-robotics) · Moneyhouse(Flexion Robotics AG 登记)。
📄 媒体：The Robot Report · Crunchbase News · EU-Startups · startupticker.ch · theaiinsider.tech(2026-06-29)。
⚠️ 技术细节多为公司自述/融资公关，按 🤖/👔 营销级证据对待，待论文或独立复现升级。