跳转至

机器人知识库

RoboCat —— 自我改进的多本体通用操作智能体

RoboCat（自我改进的通用操作智能体）¶

📌 一句话：多本体、多任务的通用操作智能体——少量示范即可适配新任务，再用自己生成的数据回灌训练，形成"自我改进"闭环。 🔬 全文精读 + 关键图 + 数字：详读-RoboCat

🧰 对我们（速判）¶

能借：⚠️ DeepMind 项目，未开源权重（待核），借的是"自生成数据 → 自我改进循环"的方法论。
资源：工业级多本体数据；范式价值 > 直接复用价值。
证据：A（DeepMind + TMLR + 官方博客）。

关键（摘要级）¶

📄 基于自模仿 / Gato 系思路的多本体 generalist agent。
📄 核心卖点：模型自己产数据用于下一轮训练（autonomous improvement loop）。

来源¶

📄 RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation, arXiv 2306.11706（TMLR 2024）· 官方博客
关联：卡片-Octo · 概念-机器人数据与标注