【实习】小红书应用算法部基础模型算法团队 - 实习(Intern)版 - 北大未名BBS
返回本版
1
/ 1
跳转

【实习】小红书应用算法部基础模型算法团队

[复制链接]
楼主

relaxxx [离线]

lalala

0.3新手上路

发帖数:2 原创分:0
<只看ta> <ASCIIArt>
1楼

【小红书|社招/校招/实习】

💼团队: 小红书应用算法部基础模型算法团队

📍Base地: 北京/上海/杭州 


【岗位一】

基础模型算法工程师 - LLM Post-training (Alignment/Reasoning/Agent)

🚀 岗位定位

本岗位聚焦大语言模型核心能力升级,通过前沿 Post-training 技术体系,实现模型在Reasoning、Agentic以及人类意图对齐上达到业界顶尖水平,全面支撑小红书搜索、广告、推荐、电商、客服、智能发布等全场景 AI 能力底座建设。

🎯 工作内容

1. 大规模对齐与强化学习: 研发并优化 SFT、RL(如GRPO 等)算法,构建高精度的 Reward Model,解决模型在复杂指令下的对齐问题。

2. 推理模型(Reasoning)优化: 探索长链推理(CoT)、强化学习驱动的自反思与自进化机制,提升模型在的 System 2 思维能力。

3. Agentic RL 与Agency: 研发面向 Search Agent、Code Agent 和 Tool-use Agent 的强化学习方案,提升模型在开放环境中的任务拆解、工具调用及闭环执行能力。

4. 合成数据与模型进化: 探索高质量合成数据的生成与过滤技术,实现模型能力的自我循环与持续进化。

🌟 我们希望你具备

1. 背景: 计算机、数学等相关专业硕士/博士;深入理解 Transformer 架构及大模型训练全流程。

2. 专业深耕: 在 Search(搜索)、Code(代码生成/工程)、tool-use、alignment 或 RL(强化学习) 领域有深厚积累。

3. 工程能力: 熟练使用 PyTorch,有 DeepSpeed、Megatron-LM 或 Ray 等大规模分布式训练实战经验。

4. 加分项:

在 NeurIPS, ICML, ICLR, ACL 等顶会发表过高质量论文。

在 LLM 大家关注的 Benchmark 榜单有深入研究或优异表现。

有大规模集群调优经验或知名开源 LLM 项目核心贡献者。


【岗位二】

大模型 Agent 算法工程师/专家

🚀 岗位定位

依托小红书 “生活决策指南” 核心定位,本岗位旨在推动信息检索向意图满足与智能服务进化;负责社区原生 Agent 平台建设,通过 LLM、RAG、Multi-Agent 等技术,精准理解用户复杂的非结构化 Query(如旅游攻略、装修避坑、穿搭建议),调度全站内容与工具资源,提供一站式问题解决方案。

🎯 工作内容

1. Agent 核心架构建设:负责通用 Agent 框架的设计与研发,包括意图识别(Router)、任务编排(Planning)、工具调用(Function Calling)及多轮对话状态管理(Memory),构建支持高并发、低延迟的在线智能分发系统。

2. 大模型调优与对齐:基于开源或自研基座模型,利用 SFT、RL 等技术进行垂直领域微调。增强模型的小红书风格化表达(社区感)、复杂指令遵循能力及工具调用准确率等。

3. 垂类智能体落地:深入旅游、美妆、装修、法律等核心垂类,设计专有的 Workflow,打通笔记、商卡、POI 等结构化数据,提升用户从“搜索”到“决策”的转化效率。

4. 评测与迭代体系:建设 Agent 自动化评测平台(LLM-as-a-Judge),制定涵盖准确性、相关性、有用性及安全性的多维评估指标,通过离线评测与在线 A/B 实验持续驱动效果优化。

🌟 我们希望你具备

1. 背景:计算机、人工智能等相关专业硕士及以上学历,具备扎实的机器学习/深度学习理论基础,精通 Python,熟练使用 PyTorch 等框架。

2. LLM 经验:深入理解 Transformer 架构,有大模型 Pre-training、SFT、RL 全流程实战经验。熟悉 LoRA、P-Tuning 等参数高效微调方法。

3. 业务落地能力:具备极强的工程落地能力,对数据有敏锐的洞察力,善于从海量非结构化数据(User Query, Notes, Comments)中挖掘价值。

4. 加分项:

在 NeurIPS, ICML, ICLR, ACL 等顶会发表过高质量论文。

在 LLM 大家关注的 Benchmark 榜单有深入研究或优异表现。


【岗位三】

基础模型算法工程师 - VLM Post-training (Multimodal/Reasoning)

🚀 岗位定位

本岗位侧重于构建大模型的“视觉与感知”能力,基于小红书业界最独特的 UGC 图文 / 视频生态,开展 VLM 的 Post-training,实现深度多模态理解,全面支撑小红书搜索、广告、推荐、电商、客服、智能发布等核心业务场景。

🎯 工作内容

1. 多模态对齐与指令遵循: 负责 VLM 的 SFT 与 RL 流程,优化图文/视频与文本的语义对齐,提升模型在复杂多模态指令下的表现。

2. VLM Reasoning: 探索视觉场景下的逻辑推理能力(如视觉、复杂视频序列理解),让 VLM 具备“边看边思考”的能力。

3. 多模态 Agent: 研发具备视觉反馈的智能体技术,利用 VLM 驱动复杂工具调用。

4. 视频理解与长文本视觉: 针对小红书海量视频场景,优化长视频理解能力及多帧推理效率,挖掘视频数据的深层语义。

🌟 我们希望你具备

1. 背景: 计算机、视觉、机器人等相关专业硕士/博士;熟悉主流 VLM 架构(如 LLaVA, Qwen-VL, InternVL 等)。

2. 专业深耕: 在 计算机视觉(CV)、多模态学习 或 视频理解 领域有深入研究。

3. 工程能力: 精通 PyTorch,熟悉多模态模型的数据预处理流水线及大规模多机多卡训练。

4. 加分项:在 CVPR, ICCV, ECCV, NeurIPS 等顶会发表过视觉或多模态相关高质量论文。


🌈 福利

1. 顶配资源: 充足的 H800 计算资源,支持任何前沿想法的验证。

2. 数据高地: 亿级 UGC 图文/视频数据,独一无二的真实业务反馈闭环。

3. 技术导向: 团队大牛云集,Leader 亲自带队,撰写高质量技术报告与论文,打造行业影响力。

4. 快速成长: 处于 AGI 落地爆发期,你的算法将直接改变亿级用户的搜索与创作体验。

📥 投递方式

简历投递邮箱: qinyang@xiaohongshu.com

邮件主题格式: 姓名-学校-社招/校招/实习-最早入职时间(for 实习)

发表于2026-03-09 17:23:46
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入