北京大學(xué)數(shù)據(jù)與智能實驗室(PKU-DAIR) 2025年度總結(jié)
2025年,實驗室在科研創(chuàng)新與團(tuán)隊協(xié)作方面持續(xù)深耕,取得一系列扎實成果。師生在探索與實踐中共同成長,多個項目獲得重要進(jìn)展。感謝各位朋友一直以來的支持,期待新一年繼續(xù)攜手前行!
2025年1月回顧
2025年1月,我組成員7項成果被錄用。
【論文錄用】
- 我組博士生劉新一、王馭捷等合作的一篇論文被ICLR 2025錄用;
- 我組博士生覃彥釗的一篇論文被ICLR 2025錄用;
- 我組博士生楊靈的兩篇論文被ICLR 2025錄用;
- 我組科研實習(xí)生王子豪的一篇論文被ICLR 2025錄用;
- 我組博士生王馭捷和碩士生竺沈涵等合作的兩篇論文被ASPLOS 2025錄用。
【論文匯總】
- Xinyi Liu, Yujie Wang, Fangcheng Fu, Xupeng Miao, Shenhan Zhu, Xiaonan Nie, Bin Cui: "NetMoE: Accelerating MoE Training through Dynamic Sample Placement", ICLR 2025 (Spotlight)
- Yanzhao Qin, Tao Zhang, Tao Zhang, Yanjun Shen, Wenjing Luo, Haoze Sun, Yan Zhang, Yujing Qiao, Weipeng Chen, Zenan Zhou, Wentao Zhang, Bin Cui:" SysBench: Can Large Language Models Follow System Messages?", ICLR 2025
- Xinchen Zhang, Ling Yang, Guohao Li, Yaqi Cai, Jiake Xie, Yong Tang, Yujiu Yang, Mengdi Wang, Bin Cui: "IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation", ICLR 2025
- Ling Yang, Zhaochen Yu, Tianjun Zhang, Minkai Xu, Joseph E. Gonzalez, Bin Cui, Shuicheng Yan, "SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights", ICLR 2025
- Zihao Wang, Bin Cui, Shaoduo Gan,"SqueezeAttention: 2D Management of KV-Cache in LLM Inference via Layer-wise Optimal Budget", ICLR 2025
- Yujie Wang, Shenhan Zhu, Fangcheng Fu, Xupeng Miao, Jie Zhang, Juan Zhu, Fan Hong, Yong Li, Bin Cui: Spindle: "Efficient Distributed Training of Multi-Task Large Models via Wavefront Scheduling", ASPLOS 2025
- Yujie Wang, Shiju Wang, Shenhan Zhu, Fangcheng Fu, Xinyi Liu, Xuefeng Xiao, Huixia Li, Jiashi Li, Faming Wu, Bin Cui: "FlexSP: Accelerating Large Language Model Training via Flexible Sequence Parallelism", ASPLOS 2025
2025年2月回顧
2025年2月,我組成員2項成果被錄用。
【論文錄用】
- 我組博士生李昊洋,碩士生葛浩等合作的一篇論文被SIGMOD 2025錄用;
- 我組博士生張海林,碩士生季曉東等合作的一篇論文被SIGMOD 2025錄用。
【論文匯總】
- Haoyang Li, Fangcheng Fu, Hao Ge, Sheng Lin, Xuanyu Wang, Jiawen Niu, Yujie Wang, Hailin Zhang, Xiaonan Nie, Bin Cui: Malleus: "Straggler-Resilient Hybrid Parallel Training of Large-scale Models via Malleable Data and Model Parallelization", SIGMOD 2025
- Hailin Zhang, Xiaodong Ji, Yilin Chen, Fangcheng Fu, Xupeng Miao, Xiaonan Nie, Weipeng Chen, Bin Cui: "PQCache: Product Quantization-based KVCache for Long Context LLM Inference", SIGMOD 2025
2025年3月回顧
2025年3月,我組成員2項成果被錄用。
【論文錄用】
- 我組博士生黃世悅,碩士生王子威等的論文被TKDE錄用;
- 我組2024屆博士沈彧,碩士生徐貝澄、博士生陸宇鵬等合作的一篇論文被ICDE 2025錄用。
【論文匯總】
- Shiyue Huang, Ziwei Wang, Yinjun Wu, Yaofeng Tu, Jiankai Wang, Bin Cui: "OpDiag: Unveiling Database Performance Anomalies through Query Operator Attribution", TKDE 2025
- Yu Shen, Beicheng Xu, Yupeng Lu, Donghui Chen, Huaijun Jiang, Zhipeng Xie, Senbo Fu, Nan Zhang, Yuxin Ren, Ning Jia, Xinwei Hu, Bin Cui: "A-Tune-Online: Efficient and QoS-aware Online Configuration Tuning for Dynamic Workloads", ICDE 2025
【榮譽獎項】
祝賀我組博士生張海林、陳伯軒等發(fā)表于SIGMOD 2024的論文榮獲SIGMOD 2024 Honorable Mention for Best Artifact獎。
SIGMOD會議是數(shù)據(jù)庫領(lǐng)域最具影響力的頂級國際學(xué)術(shù)會議之一,與VLDB和ICDE并稱為數(shù)據(jù)庫領(lǐng)域的三大頂級會議。PKU-DAIR實驗室發(fā)表于SIGMOD 2024的研究成果《CAFE: Towards Compact, Adaptive, and Fast Embedding for Large-scale Recommendation Models》榮獲SIGMOD 2024 Honorable Mention for Best Artifact獎,該獎項每年僅授予至多三篇文章,旨在表彰那些在可復(fù)現(xiàn)性、靈活性和可移植性方面表現(xiàn)卓越的研究工作。
【學(xué)術(shù)活動】
2025年3月30日至4月3日,我組博士生王馭捷、碩士生竺沈涵前往荷蘭鹿特丹參加國際學(xué)術(shù)會議ASPLOS 2025,并在會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖1. ASPLOS 2025會議合影
2025年4月回顧
2025年4月,我組成員2項成果被錄用。
【論文錄用】
- 我組碩士生林晟、博士生李昊洋等合作的一篇論文被VLDB 2025論文錄用。
- 我組碩士生葛浩的一篇論文被SIGCOMM 2025論文錄用。
【論文匯總】
- Sheng Lin, Fangcheng Fu, Haoyang Li, Hao Ge, Xuanyu Wang, Jiawen Niu, Yaofeng Tu, Bin Cui:"LobRA: Multi-tenant Fine-tuning over Heterogeneous Data", VLDB 2025
- Hao Ge, Junda Feng, Qi Huang, Fangcheng Fu, Xiaonan Nie, Lei Zuo, Haibin Lin, Bin Cui, Xin Liu: "ByteScale: Communication-Efficient Scaling of LLM Training with a 2048K Context Length on 16384 GPUs", SIGCOMM 2025
【學(xué)術(shù)活動】
2025年4月24日至28日,我組博士生王馭捷、覃彥釗與劉新一前往新加坡參加國際學(xué)術(shù)會議ICLR 2025,并在會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖2. ICLR 2025會議合影
2025年5月回顧
2025年5月,我組成員2項成果被錄用。
【論文錄用】
- 我組博士生盛則昂的一篇論文被KDD 2025 錄用;
- 我組博士后賴沛超的一篇論文被ACL 2025錄用;
【論文匯總】
- Zeang Sheng, Weiyang Guo, Yingxia Shao, Wentao Zhang, Bin Cui: "LLMs are Noisy Oracles! LLM-based Noise-aware Graph Active Learning for Node Classification", KDD 2025
- Peichao Lai, Zhengfeng Zhang, Wentao Zhang, Fangcheng Fu, Bin Cui: "Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning", ACL 2025
【學(xué)術(shù)活動】
2025年5月19日至5月23日,我組碩士生沈思綺、徐貝澄前往中國香港參加國際學(xué)術(shù)會議ICDE 2025,并在會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖3. 沈思綺在ICDE 2025作學(xué)術(shù)報告

圖4. 徐貝澄在ICDE 2025作學(xué)術(shù)報告
2025年6月回顧
2025年6月,我組成員1項成果被錄用。
【論文錄用】
我組博士生夏義扉、本科生凌宿寒等合作的一篇論文被ICCV 2025錄用。
【論文匯總】
- Yifei Xia, Suhan Ling, Fangcheng Fu, Yujie Wang, Huixia Li, Xuefeng Xiao, Bin Cui: "Training-free and Adaptive Sparse Attention for Efficient Long Video Generation", ICCV 2025
【學(xué)術(shù)活動】
2025年6月22日至6月27日,我組博士生李昊洋、碩士生季曉東前往德國柏林參加國際學(xué)術(shù)會議SIGMOD 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖5. SIGMOD 2025會議合影
2025年7月回顧
2025年7月,我組成員獲得多個榮譽獎項。
【榮譽獎項】
- 我組博士生張海林獲評北京大學(xué)2025年優(yōu)秀博士學(xué)位論文,指導(dǎo)教師為崔斌教授。
- 我組本科生凌宿寒獲評信息科學(xué)技術(shù)學(xué)院2021級本科生“十佳”優(yōu)秀畢業(yè)論文,指導(dǎo)教師為崔斌教授。

圖6. 張海林(左)與導(dǎo)師崔斌教授(右)

圖7. 凌宿寒(左)與崔斌教授(右)
【學(xué)術(shù)活動】
2025 年7月27日至8月1日,我組博士后賴沛超前往奧地利維也納參加國際學(xué)術(shù)會議ACL 2025, 會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖8. 賴沛超參加ACL 2025會議
2025年8月回顧
2025年8月,我組成員2項成果被錄用。
【論文錄用】
- 我組博士生李昊洋,碩士生林晟等合作的一篇論文被SIGMOD 2026錄用;
- 我組博士后賴沛超的一篇論文被EMNLP 2025錄用。
【論文匯總】
- Haoyang Li, Fangcheng Fu, Sheng Lin, Hao Ge, Xuanyu Wang, Jiawen Niu, Jinbao Xue, Yangyu Tao, Di Wang, Jie Jiang, Bin Cui: "Hydraulis: Balancing Large Transformer Model Training via Co-designing Parallel Strategies and Data Assignment",SIGMOD 2026
- Peichao Lai, Jiaxin Gan, Feiyang Ye, Wentao Zhang, Fangcheng Fu, Yilei Wang, Bin Cui:"Improving Low-Resource Sequence Labeling with Knowledge Fusion and Contextual Label Explanations",EMNLP 2025
【學(xué)術(shù)活動】
2025年8月3日至8月7日,我組博士生盛則昂前往加拿大多倫多參加國際學(xué)術(shù)會議KDD 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖9. KDD 2025會議留影
2025年9月回顧
2025年9月,我組成員1項成果被錄用。
【論文錄用】
- 我組博士生楊靈的一篇論文被NeurIPS 2025錄用。
【論文匯總】
- Ling Yang, Xinchen Zhang, Ye Tian, Shiyi Zhang, Chenming Shang, Minghao Xu, Wentao Zhang, Bin Cui: "HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation", NeurIPS 2025
【學(xué)術(shù)活動】
2025年9月1日至9月5日,我組碩士生林晟前往英國倫敦參加國際學(xué)術(shù)會議 VLDB 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖10. VLDB 2025會議合影
2025年10月回顧
【學(xué)術(shù)活動】
2025年10月19日-10月23日,我組博士生夏義扉前往美國夏威夷參加國際學(xué)術(shù)會議ICCV 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖11. 夏義扉參加ICCV 2025會議
2025年11月回顧
2025年11月,我組成員2項成果被錄用,參與多項學(xué)術(shù)活動。
【論文錄用】
- 我組碩士生徐貝澄、碩士生劉瑋、丁克堯等合作的一篇論文被 AAAI 2026論文錄用;
- 我組碩士生王煊宇、博士生李昊洋等合作的一篇論文被PPoPP 2026錄用。
【論文匯總】
- Beicheng Xu, Wei Liu, Keyao Ding, Yupeng Lu, Bin Cui: "PSEO: Optimizing Post-hoc Stacking Ensemble Through Hyperparameter Tuning", AAAI 2026 (Oral)
- Xuanyu Wang, Fangcheng Fu, Haoyang Li, Hao Ge, Sheng Lin , Jiawen Niu, Bin Cui: "Elastor: Elastic and Efficient Model Partitioning and Checkpointing for Fault-tolerant Distributed Training", PPoPP 2026
【學(xué)術(shù)活動】
- 2025 年11月5日至11月9日,我組博士后賴沛超前往中國蘇州參加國際學(xué)術(shù)會議EMNLP 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖12. 賴沛超參加EMNLP 2025會議
2. 2025年11月14日至11月15日,我組博士生劉新一等同學(xué)前往中國香港參加國際學(xué)術(shù)研討會FAISys 2025,會議期間就其研究成果進(jìn)行學(xué)術(shù)報告。

圖13. FAISys 2025會議合影
2025年12月回顧
我組博士生張海林、碩士生季曉東等合作的研究成果“PQCache: Product Quantization-based KVCache for Long Context LLM Inference”,被美國伯克利大學(xué)SkyLab實驗室所主導(dǎo)的SkyLight榜單(https://sky-light.eecs.berkeley.edu/#/home)評估多項指標(biāo)名列第一,驗證了我組研究工作的有效性。
結(jié) 語

辭別2025的忙碌與收獲,迎接2026的希望與好運。馬踏新春福氣到,家家戶戶納福安。祝福新老朋友們,馬年行大運,馬到成功事事順,駿馬奔騰步步高,事業(yè)蒸蒸日益興!新春快樂!
實驗室簡介
北京大學(xué)數(shù)據(jù)與智能實驗室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR實驗室)由北京大學(xué)計算機(jī)學(xué)院崔斌教授領(lǐng)導(dǎo),長期從事數(shù)據(jù)庫系統(tǒng)、大數(shù)據(jù)管理與分析、人工智能等領(lǐng)域的前沿研究,在理論和技術(shù)創(chuàng)新以及系統(tǒng)研發(fā)上取得多項成果,已在國際頂級學(xué)術(shù)會議和期刊發(fā)表學(xué)術(shù)論文200余篇,發(fā)布多個開源項目。課題組同學(xué)曾數(shù)十次獲得包括CCF優(yōu)博、ACM中國優(yōu)博、北大優(yōu)博、微軟學(xué)者、蘋果獎學(xué)金、谷歌獎學(xué)金等榮譽。PKU-DAIR實驗室持續(xù)與工業(yè)界展開卓有成效的合作,與騰訊、阿里巴巴、蘋果、微軟、百度、快手、中興通訊等多家知名企業(yè)開展項目合作和前沿探索,解決實際問題,進(jìn)行科研成果的轉(zhuǎn)化落地。

評論 0