【社招】美团多模态大模型性能优化工程师(2年以上
岗位目的:
支持多模态模型在应用场景落地时的性能优化和部署工作。 搭建自动化模型优化和部署的工具链。 配合业务持续迭代线上模型、优化资源利用率。
岗位职责:
1. 分析业务多模态模型计算性能瓶颈,资源利用率情况,制定算法或者工程方案,提高模型的计算性能、优化资源利用率。
2. 通过模型压缩蒸馏、高性能算子开发、分布式计算或虚拟化部署等方式,持续优化业务的多模态模型性能和资源利用率。
3. 将模型优化的技术沉淀为可服用的工具链或者平台,支持算法和业务自动化、高效的完成模型优化。
4. 持续调研业界前沿的多模态模型推理性能优化技术,编写清晰的技术文档,分享优化经验,支持团队技术能力的提升。
岗位要求:
1. 计算机相关专业本科及以上学历,有2年及以上相关行业工作经验。
2. 熟悉LLM, Diffusion等相关模型结构和推理流程,熟悉GPU、NPU、分布式相关硬件原理。
3. 具备良好的编程能力,熟练掌握Python/C++,有优秀的代码规范意识。
4. 熟悉深度学习框架(如Pytorch, TensorRT/OnnxRuntime、VLLM/SGLang)或多模态模型工具链(如Diffusers)。
5. 熟悉模型量化、剪枝、知识蒸馏、模型并行等优化技术,具备相关实践经验。
6. 具备良好的问题分析和解决能力,能够快速定位和解决模型性能问题。
岗位亮点:
1. 参与前沿多模态大模型应用落地,推动大规模行业级应用。
2. 与基座大模型算法团队合作,紧跟前沿技术发展。
具备以下优先:
1. 有Diffusion, Flow Matching相关模型优化和落地经验
2. 发表过多模态大模型性能优化相关论文。
欢迎投递简历至 lishengxi@meituan.com