团队:人民大学 张静(Jing Zhang) 组 —— NLP/Text-to-SQL 起家、2025 转 VLA¶
📌 一句话:强 LLM/推理组带"造数据 + 推理监督"的优势跨界打 VLA。方法学可信,真机/硬件落地是新血、待观察。 🔗 出本库卡片:卡片-ZR-0(密集 ECoT 当训练监督、推理时丢弃)。 🧭 溯源方法:_方法-研究团队溯源。
PI / 血统¶
- 张静(Jing Zhang) ✅:人民大学信息学院 CS 系 教授。
- 血统:清华博士,师从 唐杰(Jie Tang) + 李涓子(Juanzi Li) —— AMiner / 知识图谱那一脉。
- 自述方向:知识工程 + 大模型对齐(数据合成 / RL / 训练-推理优化)。主页
xiaojingzi.github.io。
学生 / 成员(具身线)¶
- Youhe Feng、Yang Li ✅:张静名下做具身的博士生,均为 卡片-ZR-0 共同作者(作者与组交叉印证,排除同名误认)。
- Haoyang Li 🤖(高置信):ZR-0 一作,极可能即 OmniSQL/CodeS 一作 —— 数据合成/Text-to-SQL 出身。
代表作 / DNA¶
- GitHub org
RUCKBReasoning(39+ repo),高星全是 NLP/DB: - OmniSQL(451★,规模化合成 Text-to-SQL 数据)、RESDSQL(281★,AAAI23)、TableLLM(251★)、CodeS(199★,SIGMOD24)、SubgraphRetrievalKBQA、SpreadsheetBench。
- DNA 一句话:Text-to-SQL + KBQA + 表格推理 + 大规模数据合成 / CoT 推理 / 大模型对齐。ZR-0 前机器人相关 = 0。
当前主攻(2025 →):具身智能是真·新方向¶
- 主页新开 "Embodied Intelligence(VLA/WAM/Agent)",已有:
- From Pixels to Tokens:VLA 隐动作监督系统研究,ICML'26 Oral ✅ ← 含金量高,证明能产出被顶会认可的 VLA 方法学。
- ProcVLM(过程接地进度奖励,2025)、Action Draft-and-Verify(自验证 VLA,2026)、ZR-0(2026-06)。
与我们主线的交集¶
- VLA / 具身推理:ECoT 当推理监督(卡片-ECoT 的推进版:训练监督、推理丢弃)。
- 数据合成:ProcCorpus-60M 逐帧密集 ECoT 标注 = OmniSQL 式"规模化造数据"肌肉的迁移。
- 暂无触觉;但"推理链加一段力/接触 grounding"是可能接口(见 卡片-ZR-0 批注)。
成色(该信 / 该疑)¶
- 非野鸡组 ✅:VLDB/SIGMOD/AAAI/ACL 高产 + ICML26 VLA Oral + 清华 AMiner 血统。
- 该更信(家学):ECoT 推理监督 / 数据合成管线 / "训练监督-推理丢弃"的对齐技巧。
- 该保留疑(无血统):真机 / 灵巧操作 / 硬件部署——全组零硬件历史,实机数字比仿真更该打折(与 ZR-0 自认短板一致:Hang Cups 弱、数据仅 ~1000h)。
📡 追踪信号(怎么 follow)¶
- 主页:
xiaojingzi.github.io(看 "Embodied Intelligence" 栏更新)。 - GitHub:
github.com/RUCKBReasoning(盯有没有放出 ZR-0 之后的 VLA repo / ProcCorpus 数据)。 - Google Scholar:搜 "Jing Zhang 人大 / Haoyang Li OmniSQL"。
- 盯点:① 数据规模是否上量(作者自认 ~1000h 是瓶颈);② 是否补真机/灵巧硬件短板;③ 学生(Youhe Feng/Yang Li)毕业去向。
来源¶
- GitHub RUCKBReasoning · 张静主页 xiaojingzi.github.io · OmniSQL(VLDB25) · CodeS(SIGMOD24)(✅ 2026-07-02 联网核实)。