首页版面好友提醒登录
返回实习版

语言大模型研究实习生招聘(推理模型-强化学习方向)

wizardIWizard 2025-04-17 14:07:53
[楼主]1楼

招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:


------------------------------------------------------------------------------------------------------


 没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~


------------------------------------------------------------------------------------------------------


职位描述

1、负责大语言模型(LLM)中的强化学习方向技术研究,提升大模型在数学/代码等推理方面的能力; 

2、强化学习框架训练的调优。


岗位要求

1、 对大模型,强化学习有一定的研究基础,熟悉主流模型和算法,之前有实践经验最好,没经验也OK,好苗子可以培养的。 有想法,有热情,脑子转的快,有一定的独立研究能力,主动些,不要只听安排来干活; 

2、基础扎实,需要你有一定的工程能力,可以动手写代码对算法进行优化,有能力对 verl / openRLHF 等 强化训练框架进行效率上的优化。


简历可以直接发给我: wangjiakang@kuaishou.com,然后可以私信下同时也。



CatalystMjim 2025-04-17 14:38:00
2楼

26届有转正机会吗

wizardI (Wizard) 在 ta 的帖子中提到:

招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:

------------------------------------------------------------------------------------------------------

 没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~

……