研究兴趣
- 大模型基础设施
任何产品和技术都需要不断降低成本才能发展。
- 模型系统共同设计
系统研究者往往面临两难困境:对于一个有潜力的应用,如果等它火了再做适配的系统,那这个系统肯定早就有人做过了;如果应用没火的时候就开始做,万一后来这个应用没人用,那等于白做一个系统。想要破解两难困境,就需要引领应用的发展。
什么因素决定模型的智能水平?我认为只有两个:训练数据和参数规模。模型结构没有那么重要,只要有个Attention,再加点深度层,训练出来就有效果。那么在我们消耗大量的计算资源去训练更大参数规模的模型之前,能不能先找到一个推理高效、训练高效的结构,使得参数规模扩大,但计算成本没有扩大呢?
- 容错网络
- 流量工程
安全和可靠是网络的基础,在此之上我们追求高效和便捷。
论文出版
中国人何必为难中国人,我尽量做到每一篇论文都有中文版,每一篇论文的代码都公开。中文版没有经过校对,可能会有错别字和翻译不准确的情况,此时以英文版为准。没来得及写中文版的论文我会先写一个博客帮助理解。
J. Hu, F. Li, M. Xu, F. Meng, S. Zhao, T. Hu, T. Peng, A. Liu, W. Huang, C. Liu, Z. Hua, T. Xie. Lil: Less is Less When Applying Post-Training Sparse-Attention Algorithms in Long-Decode Stage. arXiv preprint arXiv:2601.03043
[preprint]
H. Zhang, H. Dai, Y. Qu, C. Xiang, Y. Sui, S. Zhao, Z. Zheng, G. Chen. Deploying UAVs and Surveillance Cameras for Continuous Omnidirectional Monitoring, in IEEE Transactions on Mobile Computing, in press.
S. Zhao, J. Zheng, G. Chen. Handling Traffic Uncertainty in Failure-Tolerant Traffic Engineering, in IEEE Transactions on Networking, in press.
S. Zhao, J. Zheng, G. Chen. Rethinking Failure-Tolerant Traffic Engineering with Demand Prediction, in 2025 IEEE/ACM 33rd International Symposium on Quality of Service (IWQoS), Gold Coast, Australia, 2025.
X. Song, J. Zheng, H. Qian, S. Zhao, H. Zhang, X. Pan, G. Chen. In Search of a Memory-Efficient Framework for Online Cardinality Estimation, in IEEE Transactions on Knowledge and Data Engineering, vol. 37, no. 1, pp. 392-407, Jan. 2025. [paper]
X. Song, J. Zheng, H. Qian, S. Zhao, H. Zhang, X. Pan, G. Chen. Couper: Memory-Efficient Cardinality Estimation under Unbalanced Distribution. 2023 IEEE 39th International Conference on Data Engineering (ICDE), Anaheim, CA, USA, 2023: 2753-276