【实习腾讯微信】大模型应用算法实习招聘
[复制链接] 分享:base在北京,有意向可以发简历到xminawu@tencent.com
【团队介绍】
腾讯微信视频搜索团队隶属于微信事业群搜索技术部,专注于多模态大模型的预训练、SFT/RL对齐、多模态内容理解与表征等前沿技术研究,支撑微信“搜一搜”与“视频号”等亿级用户场景下的视频搜索需求。
【工作职责】
- 负责视频搜索全链路的算法优化,涵盖召回、精排、混排、相关性建模及用户体验等核心环节;
- 深入探索基于强化学习(RL)的搜索与推荐前沿技术,包括但不限于:
- 设计并实现 Agent 驱动的复杂查询的动态任务拆解、工具调用与策略反思;
- 研究 RL 与 RAG、排序模型、多模态对齐的融合机制,提升搜索结果的准确性、多样性与用户满意度;
- 将 RL 与大模型能力深度结合,推动在线策略迭代、离线 reward 建模、DPO/RLHF 等技术在真实业务场景中的落地。
【任职要求】
- 熟悉深度学习、强化学习、机器学习基础理论,对 **RL 算法(如 PPO、DPO、GRPO 等)** 有扎实理解和实践经验;
- 对 Agent 架构、SFT、Chain-of-Thought 等方向有浓厚兴趣或项目经验;
- 具备优秀的编程实现能力(Python/PyTorch 为主),熟悉分布式训练、模型压缩与线上部署流程;
- 良好的沟通协作能力与技术热情,能快速跟进领域前沿进展;
**加分项**:
- 在 NeurIPS、ICML、ICLR、KDD、WWW、ACL、CVPR 等顶会发表 RL、Agent 或搜索相关论文;
- 有大模型 + RL 实际项目经验(如 reward modeling、策略微调);
- ACM/ICPC、Kaggle、天池等算法竞赛获奖经历。
