北京-快手-基础设施-网络中心-高性能网络研发
联系人:huzhiwen@kuaishou.com
【职位描述】
1、负责大规模AI训练和推理场景的集合通信库、RDMA协议栈研发和调优;
2、负责大规模存储等通用场景的RDMA协议栈、传输通信库及中间件的研发和调优;
3、参与构建大规模RDMA网络Lossy部署解决方案,并负责相应拥塞控制算法的研发和调优。
【任职要求】
1、硕士/博士学历,2026届毕业生,计算机系统结构/网络通信相关专业;
2、牢固的数据结构与算法、操作系统、计算机网络等方面基础知识储备;
3、良好的表达沟通能力和团队协作精神,具备较强的目标感和学习能力;
4、具备有如下一个或多个项目的经验:
- RDMA应用开发&优化、RDMA网卡驱动开发&优化;
- 通用计算场景通信库(例如UCX)使用&开发&优化;
- AI训练/推理场景集合通信库(例如NCCL)使用&开发&优化;
- 高性能存储业务场景(例如EBS)关键技术研究&开发&优化;
- AI分布式训练框架(例如torch/megatron)使用&开发&优化;
- 数据中心网络架构与Lossy RDMA网络解决方案设计;
- TCP/RDMA拥塞控制算法研发&调优&部署;
5、发表过相关高品质论文、具备相关项目经历或实习经历的优先。