跳转至

机器人知识库

Touch2Touch：跨触觉传感器的扩散生成（用一种传感器算法跑另一种信号）

Touch2Touch：把这只传感器看到的接触"翻译"成另一只¶

📅 2024-09 · 🏛 UMich（MMint/Owens）· 🏷 跨传感器·扩散生成 📌 一句话省流：各家触觉传感器长得不一样、算法不通用。Touch2Touch 训个扩散模型在传感器间"互译"——把 GelSlim 看到的接触，翻译成 Soft Bubble 会看到的样子，于是为一种传感器写的算法，能直接跑另一种传感器采的数据。 ≈ 打比方：给两种"方言"的触觉传感器配了个实时翻译。 🔬 详读：详读-Touch2Touch 🎬 演示：https://www.mmintlab.com/research/touch2touch/

🧰 对我们（可用性速判）¶

对我们的用处：和卡片-T3/卡片-AnyTouch/卡片-UniTouch 的"统一编码器"是两条路——这条是"传感器互译/补数据"。团队换硬件、或想复用别家传感器算法时是另一种解法。但消融揭示其代价：跨传感器迁移成败极度依赖数据对齐(错位 8mm 就崩)。
真实性：✅ 全文精读 + CoRL 2024 + UMich Owens 组 + 开源。
训练/微调资源：需成对/严格对齐的双传感器数据(~3.2 万)；扩散推理成本中。
能借多少(开源)：✅ 数据 + 代码(MMint Lab 项目页)。
可用性结论：可借(互译路线) / 但数据对齐要求高。
🔬 详读（全文）：详读-Touch2Touch

亮点（全文精读后定位）¶

生成式跨传感器互译：潜空间扩散(ResNet-50 编码 + 去噪 UNet)，GelSlim→Soft Bubble 深度。
功能性指标才是重点：低层像素相似度相近时，ICP 位姿等下游功能上扩散明显赢 VQ-VAE/L1-UNet/VisGel。
消融给出硬约束：padding 有害、模糊数据退化、错位 8mm 致命 → 采数必须保留可区分特征 + 严格对齐。

关键数字（每条带来源 [n]）¶

[1] 手内位姿(未见工具，对生成信号跑 ICP)：6.4° / <5° 59.4% / <10° 79.0%（真值上界 2.4°/88.4%）。✅📄
[2] 轴孔插入(未见工具)：扩散 57.33% vs VQ-VAE 40%；叠杯 73.3% vs 70%。✅📄
[3] 工具零样本分类：生成 78.7% vs 真实 88.1%；PSNR 20.4/SSIM 0.47/FID 81.7。✅📄
[4] 数据 ~32,256 配对(12 工具×2688 位姿)。✅📄

🔎 证据与可信度（见 _卡片规范）¶

论文：arXiv 2409.08269，CoRL 2024（✅ 全文精读）。
代码/数据：✅ 开源(MMint Lab)。
证据等级：A → 权重：中(偏上)。

🧪 复现条件与成本（暂不亲做，只估）¶

关键瓶颈：采严格对齐的双传感器配对数据(机器人探测网格)。
训练：潜扩散，中等算力。
侧证判价值：顶会 ✅ / 开源 ✅ / 功能性指标实证 ✅ / 但仅 2 种图像式传感器 ⚠️。

💡 我的批注 / 判断（🤖，待人复核）¶

教训 > 方法：跨触觉迁移的天花板是数据对齐质量。我们若做跨传感器迁移，标定要极严，否则白搭。
只在图像式传感器间、不建模接触动力学 → 做力控/富接触主线时价值有限；做数据复用/换硬件时有用。

来源编号¶

[1][2][3][4] arXiv 2409.08269 全文（✅，见详读-Touch2Touch）。