跳转至

团队:人民大学 张静(Jing Zhang) 组 —— NLP/Text-to-SQL 起家、2025 转 VLA

📌 一句话:强 LLM/推理组带"造数据 + 推理监督"的优势跨界打 VLA。方法学可信,真机/硬件落地是新血、待观察。 🔗 出本库卡片:卡片-ZR-0(密集 ECoT 当训练监督、推理时丢弃)。 🧭 溯源方法:_方法-研究团队溯源。

PI / 血统

  • 张静(Jing Zhang) ✅:人民大学信息学院 CS 系 教授
  • 血统:清华博士,师从 唐杰(Jie Tang) + 李涓子(Juanzi Li) —— AMiner / 知识图谱那一脉。
  • 自述方向:知识工程 + 大模型对齐(数据合成 / RL / 训练-推理优化)。主页 xiaojingzi.github.io

学生 / 成员(具身线)

  • Youhe Feng、Yang Li ✅:张静名下做具身的博士生,均为 卡片-ZR-0 共同作者(作者与组交叉印证,排除同名误认)。
  • Haoyang Li 🤖(高置信):ZR-0 一作,极可能即 OmniSQL/CodeS 一作 —— 数据合成/Text-to-SQL 出身。

代表作 / DNA

  • GitHub org RUCKBReasoning(39+ repo),高星全是 NLP/DB:
  • OmniSQL(451★,规模化合成 Text-to-SQL 数据)、RESDSQL(281★,AAAI23)、TableLLM(251★)、CodeS(199★,SIGMOD24)、SubgraphRetrievalKBQA、SpreadsheetBench。
  • DNA 一句话Text-to-SQL + KBQA + 表格推理 + 大规模数据合成 / CoT 推理 / 大模型对齐。ZR-0 前机器人相关 = 0。

当前主攻(2025 →):具身智能是真·新方向

  • 主页新开 "Embodied Intelligence(VLA/WAM/Agent)",已有:
  • From Pixels to Tokens:VLA 隐动作监督系统研究,ICML'26 Oral ✅ ← 含金量高,证明能产出被顶会认可的 VLA 方法学。
  • ProcVLM(过程接地进度奖励,2025)、Action Draft-and-Verify(自验证 VLA,2026)、ZR-0(2026-06)。

与我们主线的交集

  • VLA / 具身推理:ECoT 当推理监督(卡片-ECoT 的推进版:训练监督、推理丢弃)。
  • 数据合成:ProcCorpus-60M 逐帧密集 ECoT 标注 = OmniSQL 式"规模化造数据"肌肉的迁移。
  • 暂无触觉;但"推理链加一段力/接触 grounding"是可能接口(见 卡片-ZR-0 批注)。

成色(该信 / 该疑)

  • 非野鸡组 ✅:VLDB/SIGMOD/AAAI/ACL 高产 + ICML26 VLA Oral + 清华 AMiner 血统。
  • 该更信(家学):ECoT 推理监督 / 数据合成管线 / "训练监督-推理丢弃"的对齐技巧。
  • 该保留疑(无血统):真机 / 灵巧操作 / 硬件部署——全组零硬件历史,实机数字比仿真更该打折(与 ZR-0 自认短板一致:Hang Cups 弱、数据仅 ~1000h)。

📡 追踪信号(怎么 follow)

  • 主页:xiaojingzi.github.io(看 "Embodied Intelligence" 栏更新)。
  • GitHub:github.com/RUCKBReasoning(盯有没有放出 ZR-0 之后的 VLA repo / ProcCorpus 数据)。
  • Google Scholar:搜 "Jing Zhang 人大 / Haoyang Li OmniSQL"。
  • 盯点:① 数据规模是否上量(作者自认 ~1000h 是瓶颈);② 是否补真机/灵巧硬件短板;③ 学生(Youhe Feng/Yang Li)毕业去向。

来源

  • GitHub RUCKBReasoning · 张静主页 xiaojingzi.github.io · OmniSQL(VLDB25) · CodeS(SIGMOD24)(✅ 2026-07-02 联网核实)。