Octo(开源通用机器人策略)¶
📌 一句话:基于 Transformer 的开源通用策略,在 Open-X-Embodiment ~80 万条轨迹上训练;用扩散 head 出动作,可灵活微调到新本体、新传感器和新动作空间。 🔬 全文精读 + 关键图 + 数字:详读-Octo
🧰 对我们(速判)¶
- 能借:✅ 代码 + ✅ 权重,模块化设计、微调门槛低,是 卡片-OpenVLA 之外另一个常用开源底座。
- 资源:与 OpenVLA 同源数据(Open-X),但走"扩散动作 head + 灵活输入"路线,便于接入新观测(如触觉)。
- 证据:A(RSS 2024 + 全开源 + 社区广泛复用)。
关键(摘要级)¶
- 📄 Transformer 主干,~800k 轨迹(Open-X)训练;diffusion action head。
- 📄 强调"可微调到新机器人 / 新动作空间"的通用性与灵活输入接口。
来源¶
- 📄 Octo: An Open-Source Generalist Robot Policy, arXiv 2405.12213(RSS 2024)· 项目页 · 代码
- 关联:卡片-OpenVLA · 概念-模型架构基础 · 概念-机器人数据与标注