首页版面好友提醒登录
返回实习版 同主题展开

【实习】小红书 LLM 强化学习工程实习生

benkerbenker 2025-07-31 16:48:27
#61283

求简历,实习直招~


岗位职责

小红书大模型强化学习基础设施的开发,接入并维护强化学习工程环境,加快模型训练速度

进行大模型强化学习的相关研究,探索如何在开放领域任务(Code,web search,computer use)上高效的进行 RL Scaling,参与研究奖励模型和强化学习模型的泛化性,持续提升模型 Post-Train 能力


岗位要求

计算机、软件工程、人工智能等相关专业优先

熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力

熟悉服务端基础技术(Go/Java/Python,数据库,消息队列,微服务,多线程等)

有互联网实习经历或个人作品(Github 项目等)优先,实习时间长于 6 个月优先


加分项

有大模型领域强化学习的项目经验,曾经参与过 RL 相关的项目或对RL算法有比较深入的了解

开源社区的活跃者,参与知名开源项⽬或有⾃⼰⻓期维护的开源项⽬

在算法经验的基础上具有网站爬取,虚拟环境构建,编译器开发等相关专业经验优先



请发送简历至 xunantian@xiaohongshu.com 或者私信均可