美团北斗内推大模型算法研究员RL/推理/多模态技术  - 求职信息发布(Job_Post)版 - 北大未名BBS
返回本版
1
/ 1
跳转

美团北斗内推大模型算法研究员RL/推理/多模态技术 

[复制链接]
楼主

Mrxhao [离线]

asdpbi

2.7一般站友

发帖数:76 原创分:0
<只看ta> <ASCIIArt>
1楼

岗位职责

研究方向一:垂域LLM研究与构建​

1.基座模型架构设计与优化:参与大语言模型基座架构的设计,研究前沿技术,如稀疏激活、混合精度训练等,同时优化模型的训练和推理流程。​

2.技术创新与突破:参与前沿技术研究,如多任务学习、跨模态理解等,推动模型在复杂任务上的性能提升;探索Transformer替代架构,突破现有模型scaling law限制;同时挑战学术benchmark,为模型的性能树立新的行业标杆。​

3.强化学习算法研究:参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。​

4.垂域模型定制化构建:领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。​

5.跨部门协作与落地:与公司数据科学家、算法工程师、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。​​

研究方向二:垂域MLLM研究与构建​

​1.研究多模态表征与大语言模型融合的前沿技术,设计和实现创新算法,研究异质数据的统一编解码模型,适配多种模态下的特征统一,实现高效微调与优化。​

2.探索强化学习(RL)在多模态大模型中的应用,包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化,提升多模态理解与推理能力。

​3.持续追踪多模态与强化学习结合的最新研究进展,优化现有多模态系统架构,提升性能、效率与可扩展性,推动多模态强化学习在智能体交互、决策推理等任务中的应用。

​4.构建技术评估体系,通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用,提升多模态大模型的泛化能力和实际应用价值。​​

研究方向三:基于角色扮演的虚拟数字助理

​​1. 角色扮演技术(Role-Playing):通过模型优化、Agent构建,在人设、拟人性、情感等取得显著提升。

​2. 记忆管理与增强(Memory):通过模型长上下文,记忆抽取与管理,提升系统的记忆能力。

​3. 个性化技术:通过用户行为数据挖掘与建模,结合多轮对话上下文理解,分析用户情感状态,提升模型的个性化回复能力。

​4. 基于Agent的数字助理:通过Agent构建和基于RL的优化,实现数字助理的能力复刻和增强

任职要求

1.优秀的探索与创新能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;

2.扎实的算法功底,在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;

3.有较强的自驱力和良好的动手实践能力,对新事物有强烈的好奇心。

岗位亮点:

1.核心的业务场景:围绕百万骑手工作场景,充足的数据和计算资源,勇担社会责任,秉承“让骑手工作得更好”使命,让每位骑手享受科技红利。

2.全方位技术挑战:服务于百万骑手的复杂场景,对AIGC技术纵深提出深刻要求,从知识注入到垂域模型训练,从多模态到Agent智能体,均是我们要攀登的高峰。

3.健全的培养体系:全方位Mentor机制,保障技术能力与业务能力全面提升,深度参与行业课题的探索与攻坚。

4.扎实的团队实力:发表多篇顶会论文、“技术突破”获奖团队、多项高校合作课题,团队氛围简单纯粹,丰富的内外部交流机会。

工作城市:

北京市


简历投递邮箱:wuhao147@meituan.com

内推码:9NVFT4M

目前北斗内推进面成功率 100%,建议在投递之前可以私信 lz简单沟通一下,后续可有序在部门内联系面试官直接面试

 最后修改于2025-06-26 20:15:23
  • 发表于2025-06-26 20:04:29
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入