【AMD可远程】大模型优化算法实习生(长期有效)
[复制链接] 浏览该主题帖
<ASCIIArt>
#60336
【AMD】【可远程】大模型算法实习生(模型量化/低比特训练推理方向)(长期有效)
岗位描述:
1. 研究和开发大模型优化算法,包括但不限于模型量化、模型剪枝、模型蒸馏、模型压缩等,提高训练和推理性能;
2. 关注低比特数据类型的模型训练,分析和解决精度与性能问题;
3. 跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展。
岗位要求:
1. 深入理解大模型算法原理,至少熟悉一种生成模型;或者有模型量化/剪枝/蒸馏/压缩相关科研或项目经验;
2. 了解Flash Attention/Memory Efficient Attention等kernel的实现方法,具备kernel开发和优化能力;
3. 熟悉Python/C/C++编程,熟练掌握PyTorch等至少一种深度学习框架;
加分项:
4. 在顶级AI会议或期刊上发表过论文,或参加过国际竞赛并取得优异成绩者优先;
5. 熟悉Triton/Cutlass者优先;
6. 有大模型分布式训练经验者优先。
工作地点:
北京市朝阳区安定路5号中海国际中心
(可远程实习)
工作时间:
每周3天及以上
简历投递:
Han.Wang@amd.com
