跳转至

论文 PDF 清单(papers/ 本地有,git 不追踪)

PDF 放在 papers/(gitignored,不进 git)。本清单进 git,记录"仓库里本地应该有哪些论文"。 缺文件时按 arXiv 号重下:curl -fsSL -o papers/名字-ID.pdf https://arxiv.org/pdf/ID

触觉 × VLA(见 触觉×VLA-调研 / TacForeSight×LaWAM-对照

文件 arXiv 备注
TacForeSight-触觉世界模型 2606.11184 ⭐ 触觉版隐空间世界模型,已精读
VLA-Touch 2507.17294 NUS,外挂式双层触觉
Tactile-VLA 2507.09160 清华 Yang Gao 组(非 Surrey)
TacVLA 2603.12665 接触门控
TacCoRL 2606.11743 仿真+RL 补触觉
HapticVLA 2603.15257 触觉蒸馏,推理不用触觉;安全奖励加权流匹配(Skoltech),已精读 卡片-HapticVLA
OmniVTLA 2508.08706 语义对齐视触觉(SA-ViT+ObjTac),SJTU×帕西尼,已精读 卡片-OmniVTLA
TA-VLA 2509.07962 Torque-aware;力矩接VLA设计空间(CoRL25),已精读 卡片-TA-VLA
FD-VLA 2602.02142 Force-Distilled(另一蒸馏路线)
FTP-1-GeneralistFoundationTactilePolicy 2606.13102 ⭐首个跨传感器通才触觉策略,清华 Yang Gao 组,权重/数据/代码全开,已精读 卡片-FTP-1
T-Rex-TactileReactiveDexterousManipulation 2606.17055 ⭐⭐触觉×VLA 新锚点:变速率 MoT(慢动作专家+快触觉专家异步级联流匹配)+时序触觉VQ-VAE+100h数据集;65% vs 35%(+30pt);代码+数据开源;Berkeley×NVIDIA×Stanford,已精读 卡片-T-Rex(注意域名是 tactile-rex 非 rec)
ViTacFormer-CrossModalVisuoTactile 2506.15953 跨注意力视触觉融合+自回归未来触觉预测头(ACT基座),长程2.5min,T-Rex基线,代码开源,已精读 卡片-ViTacFormer
EgoScale-ScalingDexterousEgocentricHumanData 2602.16710 T-Rex 的预训练骨干:2万h人类第一视角视频+scaling law,纯视觉(无触觉),NVIDIA GEAR,已精读 卡片-EgoScale

触觉×机器人 扩展阅读(见 触觉×机器人-文献地图与阅读方案

文件 arXiv 备注
综述-TactileRobotics-PastFuture 2512.01106 ⭐最新全景综述,先读
综述-WhenVisionMeetsTouch 2406.12226 视触觉传感器综述
T3-TransferableTactileTransformers 2406.13640 ⭐触觉表征基础模型(接 VLA 的桥)
AnyTouch 2502.12191 跨传感器统一表征(ICLR25)
TVL-TouchVisionLanguage数据集 2402.13232 触视语数据集(ICML24)
Tac2Real-视触觉仿真Sim2Real 2603.28475 仿真零样本 91.7%
> 更多(经典 GelSight/DIGIT、Sparsh、TACTO、DIFFTACTILE 等)见文献地图 + Awesome-Touch

世界模型(视觉侧,对照触觉)

文件 arXiv 备注
LaWAM 2606.15768 ✅ 已核(2026-06-28);视觉隐空间 WAM,与 TacForeSight 对照。核心数字属实,细节规格待正文核。详见库内 LaWAM 论文解读