语言大模型研究实习生招聘(推理模型-强化学习方向)
[复制链接] 分享:招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:
------------------------------------------------------------------------------------------------------
没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~
------------------------------------------------------------------------------------------------------
职位描述
1、负责大语言模型(LLM)中的强化学习方向技术研究,提升大模型在数学/代码等推理方面的能力;
2、强化学习框架训练的调优。
岗位要求
1、 对大模型,强化学习有一定的研究基础,熟悉主流模型和算法,之前有实践经验最好,没经验也OK,好苗子可以培养的。 有想法,有热情,脑子转的快,有一定的独立研究能力,主动些,不要只听安排来干活;
2、基础扎实,需要你有一定的工程能力,可以动手写代码对算法进行优化,有能力对 verl / openRLHF 等 强化训练框架进行效率上的优化。
简历可以直接发给我: wangjiakang@kuaishou.com,然后可以私信下同时也。
26届有转正机会吗
wizardI (Wizard) 在 ta 的帖子中提到:
招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:
------------------------------------------------------------------------------------------------------
没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~
……
