[实习-微软] 分布式训练研发实习
职位描述:
微软MAI广告部门分布式机器学习框架研发实习生
1、参与分布式大模型训练框架研发,加速模型的训练和推理,提高训练的稳定性,确保模型的高效迭代;
2、调研最新技术和性能调优工具,编写算子和CUDA内核,持续提升框架的资源利用效率和易用性;
3、完成算法团队的业务需求。
任职要求:
1. 掌握Python/C++编程语言,熟练使用TensorFlow/Pytorch等训练框架。
2. 善于分析、解决工程问题,具备良好的团队协作能力。
3. 有深度学习基本知识,熟悉LLM/SLM/Transformer/Bert等模型结构更佳。
邮件发送 liuyadi#microsoft.com
过来做分布式pytorch 开发和优化