时间线 · 按研究时间(最新在前)¶
内容是按机器人框架组织的;这页是第二条索引:按时间,看领域最新动向/趋势。 自动从 126 张带 arXiv 的卡片生成。
| 年月 | 卡片 | 一句话 | arXiv |
|---|---|---|---|
| 2026-06 | 卡片-ZR-0 | ZR-0:推理"只在训练时想、部署时不想",把跨本体的高 | 2606.30552 |
| 2026-06 | 卡片-TacForeSight | TacForeSight:让机器人"未接触先预判触感"的 | 2606.11184 |
| 2026-06 | 卡片-T-Rex | T-Rex:让机器人像人一样"边摸边即时反应" | 2606.17055 |
| 2026-06 | 卡片-LaWAM | LaWAM:把别人"训完就扔的解码器"变成免费的世界模型 | 2606.15768 |
| 2026-06 | 卡片-GraspGen-X | GraspGen-X:跨本体 6-DOF 扩散抓取(sw | 2606.00998 |
| 2026-06 | 卡片-FTP-1 | FTP-1:把"杂牌触觉传感器"统一进一个通用触觉策略, | 2606.13102 |
| 2026-06 | 卡片-DexTeleop-0 | DexTeleop-0 | 2606.23431 |
| 2026-04 | 卡片-RLT | RLT:VLA 负责"大致会做",小 actor-cri | 2604.23073 |
| 2026-03 | 卡片-TacVLA | TacVLA:触觉像 attention 一样"接触才打 | 2603.12665 |
| 2026-03 | 卡片-OmniVTA | OmniVTA:两流条件生成的视触觉世界模型 + 多平台 | 2603.19201 |
| 2026-03 | 卡片-HapticVLA | HapticVLA:安全奖励加权流匹配 + 触觉蒸馏 → | 2603.15257 |
| 2026-02 | 卡片-VT-WM | VT-WM:首个多任务视觉-触觉世界模型(Meta/UW | 2602.06001 |
| 2026-02 | 卡片-FD-VLA | FD-VLA:把"力"蒸馏成一个 token,推理时不用 | 2602.02142 |
| 2026-02 | 卡片-EgoScale | EgoScale:把"人当成另一种可扩展本体",用规模换 | 2602.16710 |
| 2025-09 | 综述-视觉式触觉传感器分类 | 视觉式触觉传感器分类综述 | 2509.02478 |
| 2025-09 | 卡片-TA-VLA | TA-VLA:不加触觉传感器,只用"关节力矩"喂 VLA | 2509.07962 |
| 2025-08 | 卡片-OmniVTLA | OmniVTLA:让机器人"摸到的"和"看到的/被要求的 | 2508.08706 |
| 2025-08 | 卡片-MolmoAct | MolmoAct:先在"空间"里推理(深度→轨迹),再出 | 2508.07917 |
| 2025-07 | 卡片-VLA-Touch | VLA-Touch:给现成 VLA 在两个层级"贴"触觉 | 2507.17294 |
| 2025-07 | 卡片-Tactile-VLA | Tactile-VLA:让"轻点/用力"这种话,真的变成 | 2507.09160 |
| 2025-07 | 卡片-GraspGen | GraspGen:扩散式 6-DOF 抓取框架(生成器+ | 2507.13097 |
| 2025-06 | 卡片-WorldVLA | WorldVLA | 2506.21539 |
| 2025-06 | 卡片-ViTacFormer | ViTacFormer:把"预测下一刻的触觉"塞进策略, | 2506.15953 |
| 2025-05 | 卡片-ParkourInTheWild | Parkour in the Wild | 2505.11164 |
| 2025-05 | 卡片-DreamGen | DreamGen:只教机器人"抓放"一种活,靠视频世界模 | 2505.12705 |
| 2025-05 | 卡片-AdapTac-PredictiveForceAttention | AdapTac:力引导的预测性注意力,自适应融合视触觉 | 2505.13982 |
| 2025-04 | 综述-灵巧操作模仿学习 | 灵巧操作模仿学习综述 | 2504.03515 |
| 2025-04 | 综述-力与触觉基础模型 | 力与触觉基础模型综述 | 2504.11827 |
| 2025-04 | 基准-RoboTwin | RoboTwin | 2504.13059 |
| 2025-04 | 卡片-π0.5 | π0.5 | 2504.16054 |
| 2025-04 | 卡片-HolisticFusion | Holistic Fusion | 2504.06479 |
| 2025-03 | 卡片-ReactiveDiffusionPolicy | Reactive Diffusion Policy | 2503.02881 |
| 2025-03 | 卡片-Gemini-Robotics | Gemini Robotics | 2503.20020 |
| 2025-03 | 卡片-GR00T-N1 | GR00T N1 / N1.5 / N1.6 | 2503.14734 |
| 2025-03 | 卡片-AgiBot-World | AgiBot World | 2503.06669 |
| 2025-02 | 卡片-VLAS | VLAS:别的 VLA 要先把语音转文字,它直接"用耳朵 | 2502.13508 |
| 2025-02 | 卡片-OpenVLA-OFT | OpenVLA-OFT | 2502.19645 |
| 2025-02 | 卡片-Magma | Magma:同时考下"电脑操作"和"机械臂操作"两张驾照 | 2502.13130 |
| 2025-02 | 卡片-AnyTouch | AnyTouch:把多种视触觉传感器统一,还兼顾"摸一下 | 2502.12191 |
| 2025-01 | 卡片-π0-FAST | FAST(π0-FAST) | 2501.09747 |
| 2025-01 | 卡片-SpatialVLA | SpatialVLA | 2501.15830 |
| 2025-01 | 卡片-Cosmos | Cosmos | 2501.03575 |
| 2024-12 | 基准-VLABench | VLABench | 2412.18194 |
| 2024-12 | 卡片-VPP | VPP(Video Prediction Policy) | 2412.14803 |
| 2024-12 | 卡片-TraceVLA | TraceVLA:给机器人配"运动残影",让它知道刚才手 | 2412.10345 |
| 2024-12 | 卡片-RoboVLM | RoboVLMs(构建 VLA 的设计选择研究) | 2412.14058 |
| 2024-12 | 卡片-RoboMIND | RoboMIND | 2412.13877 |
| 2024-12 | 卡片-NWM | NWM(Navigation World Models) | 2412.03572 |
| 2024-11 | 综述-世界模型 | 世界模型综述(理解世界 or 预测未来) | 2411.14499 |
| 2024-11 | 卡片-FoAR | FoAR | 2411.15753 |
| 2024-11 | 卡片-DINO-WM | DINO-WM | 2411.04983 |
| 2024-11 | 卡片-DIGIT-360 | DIGIT 360 | 2411.02479 |
| 2024-11 | 卡片-CogACT | CogACT(认知-动作组件化 VLA) | 2411.19650 |
| 2024-10 | 卡片-π0 | π0 | 2410.24164 |
| 2024-10 | 卡片-Sparsh | Sparsh:视触觉传感器的通用自监督触觉表征(含 Ta | 2410.24090 |
| 2024-10 | 卡片-RDT-1B | RDT-1B | 2410.07864 |
| 2024-10 | 卡片-LAPA | LAPA:从"无动作标签的视频"学潜动作,预训练 VLA | 2410.11758 |
| 2024-10 | 卡片-HOVER | HOVER:把"导航/操作/遥操作各要一套控制器"统一成 | 2410.21229 |
| 2024-10 | 卡片-GR-2 | GR-2 | 2410.06158 |
| 2024-10 | 卡片-DexMimicGen | DexMimicGen | 2410.24185 |
| 2024-10 | 卡片-ARCap | ARCap | 2410.08464 |
| 2024-09 | 卡片-Touch2Touch | Touch2Touch:跨触觉传感器的扩散生成(用一种传 | 2409.08269 |
| 2024-09 | 卡片-ReKep | ReKep:让 GPT-4o/视觉大模型自动"写出操作的 | 2409.01652 |
| 2024-09 | 卡片-HPT | HPT:给五花八门的机器人造一颗"通用大脑主干" | 2409.20537 |
| 2024-09 | 卡片-AnySkin | AnySkin | 2409.08276 |
| 2024-07 | 卡片-EquivariantDiffusionPolicy | Equivariant Diffusion Policy | 2407.01812 |
| 2024-07 | 卡片-ECoT | ECoT:让机器人"先把话想明白,再下手" | 2407.08693 |
| 2024-06 | 基准-RoboCasa | RoboCasa | 2406.02523 |
| 2024-06 | 卡片-T3 | T3:把"杂牌触觉传感器"统一成一种可迁移表征 | 2406.13640 |
| 2024-06 | 卡片-OpenVLA | OpenVLA | 2406.09246 |
| 2024-05 | 综述-VLA模型 | VLA 模型综述 | 2405.14093 |
| 2024-05 | 基准-SimplerEnv | 基准 · SimplerEnv(SIMPLER) | 2405.05941 |
| 2024-05 | 卡片-iVideoGPT | iVideoGPT | 2405.15223 |
| 2024-05 | 卡片-Octopi | Octopi:用大触觉-语言模型做物体属性推理(含 Ph | 2405.02794 |
| 2024-05 | 卡片-Octo | Octo | 2405.12213 |
| 2024-05 | 卡片-ConsistencyPolicy | Consistency Policy | 2405.07503 |
| 2024-04 | 综述-互联网视频学机器人 | 互联网视频学机器人综述 | 2404.19664 |
| 2024-03 | 卡片-TLV | TLV(Touch-Language-Vision):首 | 2403.09813 |
| 2024-03 | 卡片-DexCap | DexCap | 2403.07788 |
| 2024-03 | 卡片-DROID | DROID | 2403.12945 |
| 2024-03 | 卡片-3D-VLA | 3D-VLA | 2403.09631 |
| 2024-03 | 卡片-3D-DiffusionPolicy | 3D Diffusion Policy | 2403.03954 |
| 2024-02 | 基准-Colosseum | THE COLOSSEUM | 2402.08191 |
| 2024-02 | 卡片-UMI | UMI(Universal Manipulation I | 2402.10329 |
| 2024-02 | 卡片-TVL | TVL:触觉-视觉-语言对齐数据集 + 语言对齐触觉编码 | 2402.13232 |
| 2024-02 | 卡片-Genie | Genie | 2402.15391 |
| 2024-02 | 卡片-AdaFlow | AdaFlow | 2402.04292 |
| 2024-01 | 卡片-UniTouch | UniTouch(Binding Touch to Ev | 2401.18084 |
| 2024-01 | 卡片-MobileALOHA | Mobile ALOHA | 2401.02117 |
| 2024-01 | 卡片-MViTac | MViTac:自监督对比预训练的视觉-触觉多模态表征 | 2401.12024 |
| 2023-12 | 综述-机器人基础模型 | 机器人基础模型总综述 | 2312.07843 |
| 2023-12 | 卡片-RobotSynesthesia | Robot Synesthesia | 2312.01853 |
| 2023-12 | 卡片-NeuralFeels | NeuralFeels | 2312.13469 |
| 2023-12 | 卡片-GR-1 | GR-1 | 2312.13139 |
| 2023-12 | 卡片-FoundationPose | FoundationPose:新物体 6D 位姿估计+跟 | 2312.08344 |
| 2023-10 | 卡片-UniSim | UniSim | 2310.06114 |
| 2023-10 | 卡片-Open-X-Embodiment | Open X-Embodiment | 2310.08864 |
| 2023-10 | 卡片-Eureka | Eureka:让 GPT-4 自己写"奖励函数代码"、进 | 2310.12931 |
| 2023-09 | 卡片-LEAP-Hand | LEAP Hand | 2309.06440 |
| 2023-09 | 卡片-GelSight-Svelte | GelSight Svelte | 2309.10885 |
| 2023-09 | 卡片-GELLO | GELLO | 2309.13037 |
| 2023-08 | 卡片-BridgeData-V2 | BridgeData V2 | 2308.12952 |
| 2023-08 | 卡片-9DTact | 9DTact | 2308.14277 |
| 2023-07 | 卡片-RT-2 | RT-2:把"动作当文字",直接微调网络级大模型 | 2307.15818 |
| 2023-07 | 卡片-RH20T | RH20T | 2307.00595 |
| 2023-06 | 基准-LIBERO | LIBERO | 2306.03310 |
| 2023-06 | 卡片-RoboCat | RoboCat | 2306.11706 |
| 2023-05 | 卡片-Voyager | Voyager:让 GPT-4 自己在 Minecraf | 2305.16291 |
| 2023-04 | 卡片-UniDexGrasp++ | UniDexGrasp++ | 2304.00464 |
| 2023-04 | 卡片-SAM | Segment Anything | 2304.02643 |
| 2023-04 | 卡片-ALOHA | ALOHA/ACT | 2304.13705 |
| 2023-03 | 卡片-UniDexGrasp | UniDexGrasp | 2303.00938 |
| 2023-03 | 卡片-DiffusionPolicy | Diffusion Policy | 2303.04137 |
| 2023-02 | 基准-ManiSkill2 | ManiSkill2 | 2302.04659 |
| 2023-01 | 卡片-DreamerV3 | DreamerV3 | 2301.04104 |
| 2022-12 | 卡片-RT-1 | RT-1 | 2212.06817 |
| 2021-12 | 基准-CALVIN | CALVIN | 2112.03227 |
| 2021-11 | 卡片-ReSkin | ReSkin | 2111.00071 |
| 2021-09 | 卡片-LearnToWalkInMinutes | Learning to Walk in Minutes | 2109.11978 |
| 2020-05 | 卡片-DIGIT | DIGIT | 2005.14679 |
| 2019-10 | 基准-MetaWorld | Meta-World | 1910.10897 |
| 2019-10 | 卡片-DexPilot | DexPilot | 1910.03135 |
| 2019-09 | 基准-RLBench | RLBench | 1909.12271 |
| 2019-04 | 卡片-Soft-Bubble | Soft-Bubble | 1904.02252 |
| 2018-03 | 卡片-GelSlim | GelSlim | 1803.00628 |
| 2017-08 | 卡片-GelSight | GelSight(光学触觉鼻祖) | 1708.00922 |