Gemini Robotics(DeepMind 工业级 VLA)¶
📌 一句话:建立在 Gemini 2.0 之上的 VLA generalist 模型,可直接控制机器人执行动作;配套 Gemini Robotics-ER 强化具身推理,主打强泛化与可对话的物理世界交互。
🧰 对我们(速判)¶
- 能借:❌ 工业闭源系统,无权重/代码可下;价值在"大 VLM 直接驱动机器人"的产品级标杆与能力边界参考。
- 资源:Google DeepMind 级数据/算力,自建不可比;看趋势用。
- 证据:A(DeepMind 官方技术报告 + 博客)。
关键(摘要级)¶
- 📄 基座:Gemini 2.0;VLA 直接输出机器人控制动作。
- 📄 配套 Gemini Robotics-ER(Embodied Reasoning)增强空间/具身推理(细节以报告为准)。
来源¶
- 📄 Gemini Robotics: Bringing AI into the Physical World, arXiv 2503.20020(DeepMind 技术报告)· 官方博客
- 关联:卡片-Helix(工业 VLA 对照) · 卡片-π0 · 概念-模型架构基础