/ 1
【实习】阿里千问团队大模型训练及应用实习生
[复制链接] 分享:
1楼
【实习招聘】阿里集团-千问C端事业群-AI应用与创新技术部-大模型训练及应用
工作地: 北京
职位描述:通过强化学习提升万亿级参数大模型的决策认知能力,实现大模型在复杂环境下完成多轮感知-决策闭环,在前沿实践中推动AGI落地;研发新一代大模型强化学习算法,提升大模型在工具调用、复杂环境交互、多智能体交互等方向的基础能力;将强化学习研究成果融入千问&夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。
职位描述
1. 硕士及以上学历,计算机、数学、强化学习、自然语言处理等相关专业;
2. 在强化学习方面具有丰富的专业知识,熟练掌握深度强化学习算法在大语言模型中的应用及前沿知识;
3. 熟悉大模型相关深度学习框架,如Transformers、PyTorch、Megatron-LM等,有扎实的编程基础和代码实现能力;
4. 具备良好的沟通、协作和解决问题的能力,能够与团队成员密切合作,共同解决问题;
符合以下条件者优先:
1. 有大语言模型RLHF、RL reasoning、Agentic RL等方向有相关参与经验;
2. 在强化学习、大模型训练、多智能体等研究方向发表过论文;
工作氛围超好,mentor人很nice,表现优异可转正!欢迎大家投递~
有意者可将简历发至邮箱 lianshu.sjj@alibaba-inc.com
/ 1
