腾讯微信(WXG)大模型招聘,26暑期,27+日常实习
[复制链接] 分享:微信大模型训练研发工程师(工程 Infra工作)
岗位职责:
1.参与开发优化大模型训练框架,支持大规模高效稳定训练;
2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。
岗位要求:1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向;
3.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
4.对大模型前沿技术比较敏锐者优先;
5.有实际大模型的训练调参和效果评测项目经验的优先;
6.良好的沟通能力、解决问题能力。
base北京, 各职级都有有自荐或者推荐 群友欢迎滴滴我~ 备注训练框架jd。+微信+yep_cs 或者发简历到lucasbai@tencent.com
签名档
微信大模型推理研发工程师(工程 Infra工作)
岗位职责:
1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
2.优化大模型推理性能,提升吞吐并控制成本;
3.优化大模型推理框架,提升框架易用性和可调试性。
base北京, 各职级都有 备注推理jd。+微信+yep_cs 或者发简历到lucasbai@tencent.com
岗位要求:
1.熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
签名档
微信大模型业务研发工程师
1.主要负责微信AI大模型智能体平台、微信基础AI大模型业务的后台开发工作;
2.包括特性业务功能开发,基础框架建设,系统优化工作以及各AI落地业务的开发工作等。
要求:1.计算机相关专业本科及以上学历,计算机相关专业;
2.熟悉linux开发环境,熟练掌握C++开发,熟悉数据结构和算法,熟练掌握至少一门脚本语言(shell/python等);
3.有类ACM/ICPC算法竞赛背景者优先;
4.学习能力与团队协作能力强,对新技术有强烈的学习热情,能独立探索解决实际研发过程中碰到的各类问题。
欢迎搜广推c++背景,熟练c++并发即可。
base北京, 各职级都有 备注推理jd。+微信+yep_cs 或者发简历到lucasbai@tencent.com
#xk #gsm #rw #大模型 #算法
--
