OpenVLA(开源 VLA 基座代表作)¶
📌 一句话:全开源 7B VLA——Llama2 + (DINOv2/SigLIP) 视觉,在 Open-X-Embodiment ~97 万条上训;性能超 RT-2-X 等闭源大模型,可微调可下载。 🎬 项目页 · 代码 · 论文 ⚠️ 代表作占位卡:基于摘要/项目页,未精读全文。
🧰 对我们(速判)¶
- 最可上手的开源 VLA 底座:想给"现成 VLA 加触觉"做实验,OpenVLA 是常见承载体(与 卡片-VLA-Touch 外挂思路天然搭)。
- 真实性:高(CoRL24 + 全开源 + 社区广泛复用)→ 证据 A。
- 能借:✅ 代码 + ✅ 权重;微调门槛低、生态大。
与我们的关系¶
- 属大脑层纯视觉 VLA;触觉×VLA 多数工作把触觉接到这类底座上(见 概念-模型架构基础)。数据来自 概念-机器人数据与标注 的 Open-X。
来源¶
- 📄 OpenVLA, arXiv 2406.09246(CoRL 2024)· 项目页 · 代码