跳转至

UMI(Universal Manipulation Interface)

📌 一句话:用手持夹爪直接采人手"在野(in-the-wild)"演示,配合推理时延对齐 + 相对轨迹动作表示,把数据学成硬件无关、可跨平台部署的策略——不用真机就能教机器人。 🎬 arXiv 2402.10329 · 项目页 🔬 全文精读 + 关键图 + 数字详读-UMI ⚠️ 摘要级占位卡,未精读全文。

🧰 对我们(速判)

  • 数据规模:摘要未给具体小时数;强调可便携、低成本、大规模在野采集(双手/动态任务)。
  • 采集成本:极低——手持夹爪 + 相机,无需机器人本体在场。
  • 开源:项目页公开(夹爪硬件+代码),社区影响大。
  • 证据:A(Cheng Chi / Shuran Song 团队,被广泛复现与引用)。
  • 能借:手持夹爪 + 相对轨迹动作表示,是"低成本接触采数"的经典范式,可对照 卡片-DexTeleop-0 遥操作支线。

关键(摘要级)

  • 手持夹爪采"在野"人手演示 → 直接学可部署策略。📄
  • 推理时延匹配 + 相对轨迹动作表示 → 策略硬件无关、可跨多机器人平台。📄
  • 解锁动态、双手、精密、长程行为,仅靠换训练数据即可零样本泛化到新环境/物体。📄

来源