通义实验室-研究型实习生-Character Model
[复制链接] 浏览该主题帖
<ASCIIArt>
#62007
通义实验室研究型实习生招聘
研究方向:记忆Memory,角色扮演,强化学习
实习生纯research无业务,发论文为导向
base:北京杭州(北京优先)
bar:硕博, 有1篇A一作即可
加分项:
1、有记忆Memory 经验,Character Model 经验, 做过Reward model,多机多卡MoE RL训练经验。
2、一周五天,实习六个月以上
3、熟悉verl,openrlhf,llamafactory,vllm,deepspeed,fsdp,megtron等常用框架
4、熟悉PPO,GRPO,DAPO,RLOO,RF++等前沿RL工作有复现应用经历
简历发送邮箱694125111@qq.com
标明【姓名】,来自bbs可再加一个tag
#大模型 #通义 #实习 #秋招
签名档

