简介

博士研究生
计算机科学与技术系
南京大学
江苏省南京市栖霞区仙林大道163号,210023

办公室:计算机系楼427

电子邮件: shijuzhao@smail.nju.edu.cn

GitHub: shijuzhao

我在2022年毕业于南京大学数学系,取得了统计学学士学位。目前我在郑嘉琦教授和陈贵海教授的指导下攻读博士学位。我的研究方向是数据中心网络,包括数据中心内部的通信和分布在不同地理位置的数据中心之间的通信。

2024年4月,我们与华为的鲁棒优化相关合作成果突出,入选华为优秀高校合作项目。

2024年7月,我看到了大语言模型在实际应用中的潜力,转向研究大模型基础设施。

研究兴趣

  • 大模型基础设施

任何产品和技术都需要不断降低成本才能发展。

  • 模型系统共同设计

系统研究者往往面临两难困境:对于一个有潜力的应用,如果等它火了再做适配的系统,那这个系统肯定早就有人做过了;如果应用没火的时候就开始做,万一后来这个应用没人用,那等于白做一个系统。想要破解两难困境,就需要引领应用的发展。

什么因素决定模型的智能水平?我认为只有两个:训练数据和参数规模。模型结构没有那么重要,只要有个Attention,再加点深度层,训练出来就有效果。那么在我们消耗大量的计算资源去训练更大参数规模的模型之前,能不能先找到一个推理高效、训练高效的结构,使得参数规模扩大,但计算成本没有扩大呢?

  • 容错网络
  • 流量工程

安全和可靠是网络的基础,在此之上我们追求高效和便捷。

论文出版

中国人何必为难中国人,我尽量做到每一篇论文都有中文版,每一篇论文的代码都公开。中文版没有经过校对,可能会有错别字和翻译不准确的情况,此时以英文版为准。没来得及写中文版的论文我会先写一个博客帮助理解。

S. Zhao, J. Hu, J. Zheng, G. Chen. You Need an Encoder for Native Position-Independent Caching. arXiv preprint arXiv:2602.01519

[preprint] [code] [blog]

J. Hu, F. Li, M. Xu, F. Meng, S. Zhao, T. Hu, T. Peng, A. Liu, W. Huang, C. Liu, Z. Hua, T. Xie. Lil: Less is Less When Applying Post-Training Sparse-Attention Algorithms in Long-Decode Stage. arXiv preprint arXiv:2601.03043

[preprint]

H. Zhang, H. Dai, Y. Qu, C. Xiang, Y. Sui, S. Zhao, Z. Zheng, G. Chen. Deploying UAVs and Surveillance Cameras for Continuous Omnidirectional Monitoring, in IEEE Transactions on Mobile Computing, in press.

S. Zhao, J. Zheng, G. Chen. Handling Traffic Uncertainty in Failure-Tolerant Traffic Engineering, in IEEE Transactions on Networking, in press.

S. Zhao, J. Zheng, G. Chen. Rethinking Failure-Tolerant Traffic Engineering with Demand Prediction, in 2025 IEEE/ACM 33rd International Symposium on Quality of Service (IWQoS), Gold Coast, Australia, 2025.

[paper] [code]

S. Zhao, J. Hu, R. Huang, J. Zheng, G. Chen. MPIC: Position-Independent Multimodal Context Caching System for Efficient MLLM Serving. arXiv preprint arXiv:2502.01960

[preprint] [blog]

X. Song, J. Zheng, H. Qian, S. Zhao, H. Zhang, X. Pan, G. Chen. In Search of a Memory-Efficient Framework for Online Cardinality Estimation, in IEEE Transactions on Knowledge and Data Engineering, vol. 37, no. 1, pp. 392-407, Jan. 2025. [paper]

X. Song, J. Zheng, H. Qian, S. Zhao, H. Zhang, X. Pan, G. Chen. Couper: Memory-Efficient Cardinality Estimation under Unbalanced Distribution. 2023 IEEE 39th International Conference on Data Engineering (ICDE), Anaheim, CA, USA, 2023: 2753-276

[paper] [code] [中文版]

个人博客

技术博客

降低技术的认知门槛

经验博客

希望科研入门能少走弯路

  • 大模型训练踩过的那些坑(未完成)