首页版面好友提醒登录
返回实习版

【实习】微信后训练算法与应用实习生

monetwisky_123 2025-12-19 16:22:29
[楼主]1楼

【日常实习】 微信后训练算法与应用实习生

【工作地点】

北京

【工作内容】

1. 负责微信内容理解及文本生成场景中的NLP相关基础技术研发和落地应用 

2. 负责 LLM 的后训练优化,持续提升 sequence to sequence 任务的能力

3. 跟进前沿 RL 方案,优化+落地。


【要求】

1. 一周 4 天以上,实习六个月以上

2. 熟悉机器学习、深度学习的常见模型,理解模型训练与优化流程,理解大模型原理及具备大模型微调经验

3. 在自然语言处理方向有相关研究或应用经验,熟悉核心原理与前沿算法。

4. 熟悉verl,llamafactory,vllm,deepspeed,fsdp,megtron等常用框架

5. 熟悉 DPO/PPO/RL 相关算法,有 RL 调优经验。


【加分项】

1. 具有优秀的基础算法、扎实的机器学习基础,在后训练方向发表过一作顶会论文。

2. 具有优秀的代码能力,在ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖。

3. 在 pretrain / sft / RL,参与过大影响力项目(包括开源项目)。


【联系方式】

简历发送至邮箱:1010888560@qq.com

邮件主题:姓名+后训练实习+毕业年份+可实习时长