【DeepSeek】-LLM Infra 核心系统研发工程师招聘 - 计算机学院(CS)版 - 北大未名BBS
返回本版
1
/ 1
跳转

【DeepSeek】-LLM Infra 核心系统研发工程师招聘

[复制链接]
楼主

zqh [离线]

zqh

1.0一般站友

发帖数:20 原创分:0
<只看ta> <ASCIIArt>
1楼

工作描述:

1. 大语言模型的成功是 AI 基础设施的成功,这是一个相当复杂的系统工程。每个成功的大模型背后,都有无数个从硬件到软件,从存储调度到算子编译器的极致优化故事,最终将这个模型的训练效率推动到了极致。而我们的工作,就是将自己的特长发挥到极致,榨干硬件上的点滴性能,加速大语言模型的研究。

2. 若没有实际的大模型建筑,没有数据、模型、应用等等,那么基础设施将成为空谈,所以也需要工程师和算法团队紧密配合,来处理 LLM 的训练数据,来迭代 LLM 的模型算法,来探索 LLM 的应用和部署,在我们 AI基础设施之上搭建起琼楼玉宇;

3.  一个人无法穷尽 AI 核心系统的方方面面,因此我们更希望你是某个领域的专家,比如高性能计算、RDMA 网络、模型框架、算子编译器等等,能以独特经验和独到观点,从不同维度优化系统,同时具有开阔的架构视野,能够灵活地选择合适的技术来构建系统。也希望你能认同我们开放共进的企业文化,积极创新,乐于挑战,整个团队一起互通有无,博采众长,来推送整个 AGI 的发展。


基本要求:

1. 具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心

2. 具备基础的算法、策略迭代能力,有一定能力对工作中的遇到的实际问题提出解决方案

3. 熟练C++ CUDA、懂训练/推理框架的同学优先


简历投递方式:

HR邮箱:mm.han@high-flyer.cn

HR微信:18895606352

发表于2024-05-23 19:09:21
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入