Meta-World¶
📌 一句话:仿真桌面操作的多任务 / 元强化学习基准,50 个不同操作任务(开门、推、抓放…),考"在一组任务分布上学得快不快、迁移好不好"。
🧰 对我们(速判)¶
- 偏 meta-RL / 多任务 RL 研究,不是 VLA 评测主线;但作为"任务分布泛化"的经典尺常被引。
- 有标准套件 ML1 / ML10 / ML45 / MT10 / MT50,认准是哪套再横比。
- 坑:任务相对简单、密集奖励驱动,仿真高分不代表真机;现由 Farama 维护。
关键(摘要级)¶
- 📄 任务数:50 个不同机械臂操作任务。
- 📄 套件:ML1/ML10/ML45(元学习)、MT10/MT50(多任务)。
- 📄 指标:任务成功率 SR(按套件平均)。