【DeepSeek】-LLM Infra 核心系统研发工程师招聘
工作描述:
1. 大语言模型的成功是 AI 基础设施的成功,这是一个相当复杂的系统工程。每个成功的大模型背后,都有无数个从硬件到软件,从存储调度到算子编译器的极致优化故事,最终将这个模型的训练效率推动到了极致。而我们的工作,就是将自己的特长发挥到极致,榨干硬件上的点滴性能,加速大语言模型的研究。
2. 若没有实际的大模型建筑,没有数据、模型、应用等等,那么基础设施将成为空谈,所以也需要工程师和算法团队紧密配合,来处理 LLM 的训练数据,来迭代 LLM 的模型算法,来探索 LLM 的应用和部署,在我们 AI基础设施之上搭建起琼楼玉宇;
3. 一个人无法穷尽 AI 核心系统的方方面面,因此我们更希望你是某个领域的专家,比如高性能计算、RDMA 网络、模型框架、算子编译器等等,能以独特经验和独到观点,从不同维度优化系统,同时具有开阔的架构视野,能够灵活地选择合适的技术来构建系统。也希望你能认同我们开放共进的企业文化,积极创新,乐于挑战,整个团队一起互通有无,博采众长,来推送整个 AGI 的发展。
基本要求:
1. 具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心
2. 具备基础的算法、策略迭代能力,有一定能力对工作中的遇到的实际问题提出解决方案
3. 熟练C++ CUDA、懂训练/推理框架的同学优先
简历投递方式:
HR邮箱:mm.han@high-flyer.cn
HR微信:18895606352