【美团北斗实习】大模型应用算法工程师—清北内推
[复制链接] 浏览该主题帖方向一行业大模型:
岗位职责
【课题说明】
大模型研发正从“人类数据时代”跨入“经验时代”,评估已然是大模型研发的重点和难点。具体而言,评估驱动的行业大模型研发下半场范式主要包括两方面内容:①行业核心问题定义和评估归因;②Post-Training多阶段协同的效果提升。本课题基于美团的本地生活业务,精选销售、履约、医药和客服四个代表性行业,旨在探索评估驱动的行业大模型研发的下半场范式。
【建议研究方向】
1.行业大模型通用评估方案探索。
2.行业模型reward设计与探索。
3.面向行业推理能力建设的通用自动化样本构建方法和评估归因方法。
4.面向行业推理能力增强的通用强化训练方案。
5.销售、履约、医药和客服行业大模型训练。
任职要求
海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项:
1)超级学霸:专业成绩排名前1%。
2)学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。
3)竞赛大神:在顶级大赛上获奖。
4)工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目。
工作城市
北京市
方向二多场景Agent:
岗位职责
【课题说明】
以大模型对话技术为核心,探索前沿技术问题。研究方向包括角色扮演、个性化对话、记忆管理,拟人化,数字人等,主要业务场景包括运营,招聘,销售,审核等。目标是构建覆盖多个场景的Agent系统,实现“技术驱动业务范式”的升级转变。
【建议研究方向】
1. 大模型个性化(Personalized LLM):通过角色扮演、用户行为数据挖掘与建模、上下文理解等方法,分析用户情感状态,提升模型的个性化回复能力。
2. 面向语音交互的拟人化技术(Voice Agent):优化大模型在语音对话场景的效果,提升大模型的拟人化水平,探索下一代端到端语音对话大模型的技术实现。
3. 记忆管理与增强(Memory):通过优化模型长上下文能力、设计记忆抽取与管理模块,提升系统的记忆能力。
4. 基于LLM的RL(LLM-based RL):通过强化学习,提升模型规划、决策、推理等能力。
我们将提供充足的计算资源和良好的工作自由度,目标是产出有影响力的工作,解决业务实践中的问题。
任职要求
海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项:
1)超级学霸:专业成绩排名前1%。
2)学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。
3)竞赛大神:在顶级大赛上获奖。
4)工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目。
工作城市
北京市
方向三 Reasoning能力提升
岗位职责
【课题说明】
通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。
【建议研究方向】
1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。
2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。
3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。
4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。
5.基于价值观约束的大模型风险控制与安全防护。
任职要求
海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项:
1)超级学霸:专业成绩排名前1%。
2)学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。
3)竞赛大神:在顶级大赛上获奖。
4)工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目。
工作城市
北京市
简历投递邮箱:wuhao147@meituan.com
内推码:9NVFT4M
目前北斗实习内推进面成功率 100%,建议在投递之前可以私信 lz简单沟通一下,后续可有序在部门内联系面试官直接面试
