语言大模型研究实习生招聘(推理模型-强化学习方向) - 实习(Intern)版 - 北大未名BBS
返回本版
1
/ 1
跳转

语言大模型研究实习生招聘(推理模型-强化学习方向)

[复制链接]
楼主

wizardI [离线]

Wizard

2.5主序星

发帖数:52 原创分:0
<只看ta> <ASCIIArt>
1楼

招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:


------------------------------------------------------------------------------------------------------


 没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~


------------------------------------------------------------------------------------------------------


职位描述

1、负责大语言模型(LLM)中的强化学习方向技术研究,提升大模型在数学/代码等推理方面的能力; 

2、强化学习框架训练的调优。


岗位要求

1、 对大模型,强化学习有一定的研究基础,熟悉主流模型和算法,之前有实践经验最好,没经验也OK,好苗子可以培养的。 有想法,有热情,脑子转的快,有一定的独立研究能力,主动些,不要只听安排来干活; 

2、基础扎实,需要你有一定的工程能力,可以动手写代码对算法进行优化,有能力对 verl / openRLHF 等 强化训练框架进行效率上的优化。


简历可以直接发给我: wangjiakang@kuaishou.com,然后可以私信下同时也。



发表于2025-04-17 14:07:53

CatalystM [离线]

jim

2.4临客

发帖数:34 原创分:0
<只看ta> <ASCIIArt>
2楼

26届有转正机会吗

wizardI (Wizard) 在 ta 的帖子中提到:

招 1-2 位同学来一起做些有意思的工作,主要是 LLM + RL R1类推理模型的研究,目前只做代码、数学两个方向,划重点:

------------------------------------------------------------------------------------------------------

 没有任何业务上的杂活,纯面向研究,以在行业内做出有影响的工作 / 论文为导向~

……

发表于2025-04-17 14:38:00
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入