【实习】小红书应用算法部基础模型算法团队

返回本版

/ 1

跳转

[复制链接]

楼主

relaxxx [离线]

lalala

0.3新手上路

发帖数：2 原创分：0

关注

<只看ta> <ASCIIArt>

1楼

【小红书｜社招/校招/实习】

💼团队：小红书应用算法部基础模型算法团队

📍Base地：北京/上海/杭州

【岗位一】

基础模型算法工程师 - LLM Post-training (Alignment/Reasoning/Agent)

🚀 岗位定位

本岗位聚焦大语言模型核心能力升级，通过前沿 Post-training 技术体系，实现模型在Reasoning、Agentic以及人类意图对齐上达到业界顶尖水平，全面支撑小红书搜索、广告、推荐、电商、客服、智能发布等全场景 AI 能力底座建设。

🎯 工作内容

1. 大规模对齐与强化学习：研发并优化 SFT、RL（如GRPO 等）算法，构建高精度的 Reward Model，解决模型在复杂指令下的对齐问题。

2. 推理模型（Reasoning）优化：探索长链推理（CoT）、强化学习驱动的自反思与自进化机制，提升模型在的 System 2 思维能力。

3. Agentic RL 与Agency：研发面向 Search Agent、Code Agent 和 Tool-use Agent 的强化学习方案，提升模型在开放环境中的任务拆解、工具调用及闭环执行能力。

4. 合成数据与模型进化：探索高质量合成数据的生成与过滤技术，实现模型能力的自我循环与持续进化。

🌟 我们希望你具备

1. 背景：计算机、数学等相关专业硕士/博士；深入理解 Transformer 架构及大模型训练全流程。

2. 专业深耕：在 Search（搜索）、Code（代码生成/工程）、tool-use、alignment 或 RL（强化学习）领域有深厚积累。

3. 工程能力：熟练使用 PyTorch，有 DeepSpeed、Megatron-LM 或 Ray 等大规模分布式训练实战经验。

4. 加分项：

在 NeurIPS, ICML, ICLR, ACL 等顶会发表过高质量论文。

在 LLM 大家关注的 Benchmark 榜单有深入研究或优异表现。

有大规模集群调优经验或知名开源 LLM 项目核心贡献者。

【岗位二】

大模型 Agent 算法工程师/专家

🚀 岗位定位

依托小红书 “生活决策指南” 核心定位，本岗位旨在推动信息检索向意图满足与智能服务进化；负责社区原生 Agent 平台建设，通过 LLM、RAG、Multi-Agent 等技术，精准理解用户复杂的非结构化 Query（如旅游攻略、装修避坑、穿搭建议），调度全站内容与工具资源，提供一站式问题解决方案。

🎯 工作内容

1. Agent 核心架构建设：负责通用 Agent 框架的设计与研发，包括意图识别（Router）、任务编排（Planning）、工具调用（Function Calling）及多轮对话状态管理（Memory），构建支持高并发、低延迟的在线智能分发系统。

2. 大模型调优与对齐：基于开源或自研基座模型，利用 SFT、RL 等技术进行垂直领域微调。增强模型的小红书风格化表达（社区感）、复杂指令遵循能力及工具调用准确率等。

3. 垂类智能体落地：深入旅游、美妆、装修、法律等核心垂类，设计专有的 Workflow，打通笔记、商卡、POI 等结构化数据，提升用户从“搜索”到“决策”的转化效率。

4. 评测与迭代体系：建设 Agent 自动化评测平台（LLM-as-a-Judge），制定涵盖准确性、相关性、有用性及安全性的多维评估指标，通过离线评测与在线 A/B 实验持续驱动效果优化。

🌟 我们希望你具备

1. 背景：计算机、人工智能等相关专业硕士及以上学历，具备扎实的机器学习/深度学习理论基础，精通 Python，熟练使用 PyTorch 等框架。

2. LLM 经验：深入理解 Transformer 架构，有大模型 Pre-training、SFT、RL 全流程实战经验。熟悉 LoRA、P-Tuning 等参数高效微调方法。

3. 业务落地能力：具备极强的工程落地能力，对数据有敏锐的洞察力，善于从海量非结构化数据（User Query, Notes, Comments）中挖掘价值。

4. 加分项：

在 NeurIPS, ICML, ICLR, ACL 等顶会发表过高质量论文。

在 LLM 大家关注的 Benchmark 榜单有深入研究或优异表现。

【岗位三】

基础模型算法工程师 - VLM Post-training (Multimodal/Reasoning)

🚀 岗位定位

本岗位侧重于构建大模型的“视觉与感知”能力，基于小红书业界最独特的 UGC 图文 / 视频生态，开展 VLM 的 Post-training，实现深度多模态理解，全面支撑小红书搜索、广告、推荐、电商、客服、智能发布等核心业务场景。

🎯 工作内容

1. 多模态对齐与指令遵循：负责 VLM 的 SFT 与 RL 流程，优化图文/视频与文本的语义对齐，提升模型在复杂多模态指令下的表现。

2. VLM Reasoning：探索视觉场景下的逻辑推理能力（如视觉、复杂视频序列理解），让 VLM 具备“边看边思考”的能力。

3. 多模态 Agent：研发具备视觉反馈的智能体技术，利用 VLM 驱动复杂工具调用。

4. 视频理解与长文本视觉：针对小红书海量视频场景，优化长视频理解能力及多帧推理效率，挖掘视频数据的深层语义。

🌟 我们希望你具备

1. 背景：计算机、视觉、机器人等相关专业硕士/博士；熟悉主流 VLM 架构（如 LLaVA, Qwen-VL, InternVL 等）。

2. 专业深耕：在计算机视觉（CV）、多模态学习或视频理解领域有深入研究。

3. 工程能力：精通 PyTorch，熟悉多模态模型的数据预处理流水线及大规模多机多卡训练。

4. 加分项：在 CVPR, ICCV, ECCV, NeurIPS 等顶会发表过视觉或多模态相关高质量论文。

🌈 福利

1. 顶配资源：充足的 H800 计算资源，支持任何前沿想法的验证。

2. 数据高地：亿级 UGC 图文/视频数据，独一无二的真实业务反馈闭环。

3. 技术导向：团队大牛云集，Leader 亲自带队，撰写高质量技术报告与论文，打造行业影响力。

4. 快速成长：处于 AGI 落地爆发期，你的算法将直接改变亿级用户的搜索与创作体验。

📥 投递方式

简历投递邮箱： qinyang@xiaohongshu.com

邮件主题格式：姓名-学校-社招/校招/实习-最早入职时间（for 实习）

回帖
回信
转载
转寄
收入文集

发表于2026-03-09 17:23:46

返回本版

/ 1

跳转