【实习】小红书 LLM 强化学习工程实习生 - 实习(Intern)版 - 北大未名BBS

【实习】小红书 LLM 强化学习工程实习生

[复制链接] 浏览该主题帖

benker [离线]

benker

0.3新手上路

发帖数:4 原创分:0
关注
<ASCIIArt> #61243

求简历,实习直招~


岗位职责

小红书大模型强化学习基础设施的开发,接入并维护强化学习工程环境,加快模型训练速度

进行大模型强化学习的相关研究,探索如何在开放领域任务(Code,web search,computer use)上高效的进行 RL Scaling,参与研究奖励模型和强化学习模型的泛化性,持续提升模型 Post-Train 能力


岗位要求

计算机、软件工程、人工智能等相关专业优先

熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力

熟悉服务端基础技术(Go/Java/Python,数据库,消息队列,微服务,多线程等)

有互联网实习经历或个人作品(Github 项目等)优先,实习时间长于 6 个月优先


加分项

有大模型领域强化学习的项目经验,曾经参与过 RL 相关的项目或对RL算法有比较深入的了解

开源社区的活跃者,参与知名开源项⽬或有⾃⼰⻓期维护的开源项⽬

在算法经验的基础上具有网站爬取,虚拟环境构建,编译器开发等相关专业经验优先


请发送简历至 xunantian@xiaohongshu.com 或者私信均可

 最后修改于2025-07-28 10:42:14
  • 发表于2025-07-28 10:41:56

请您先 登录 再进行发帖

快捷回帖
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入