【实习】美团基座模型LongCat团队招收实习生 - 实习(Intern)版 - 北大未名BBS
返回本版
1
/ 1
跳转

【实习】美团基座模型LongCat团队招收实习生

[复制链接]
楼主

cresc [离线]

Cresc

2.0一般站友

发帖数:3 原创分:0
<只看ta> <ASCIIArt>
1楼

美团基座LongCat团队招收实习生(原生多模态-通用视频理解方向)


- 美团M17基座预训练团队,近期开源了 LongCat-Flash 560B 等系列大模型。现诚招多模态(视频理解)方向实习生,深度参与团队原生多模态大模型的研发工作。

- 团队优势:Base 北京/上海/香港,人才密度极高(清北/港三/海外名校),具备充足的计算资源。在这里,你不仅是执行者,更是前沿算法的共同探索者。

- 福利待遇:实习生优先线下表现优秀者可作为 Contributor 挂名技术报告/顶会论文。表现拔尖者可直推“北斗计划”,薪资待遇比肩行业顶尖水平。 


【算法实习生 - Video Pre-training Scaling】

- 岗位职责:

1. 探索视频 Scaling Law:深度探究视频数据在预训练阶段的扩展潜力,研究不同视频数据类型(如短视频、影视、长序列)、数据规模及图文/视频比例对基座模型性能的影响。 

2. 多维评估体系建设:构建从上游预训练指标(Loss/Entropy)到下游任务表现(理解/生成/推理)的全链路评估体系,量化视频 Scaling 的实际收益。

3. 原生多模态预训练:参与设计高效的视频表征与训练方案,优化模型在海量视频数据下的收敛稳定性与泛化能力。

- 要求: 

1. 具备基座模型预训练(Base Model Pre-training)经验,对 Scaling Law 有深刻理解。 

2. 在多模态理解、视频自回归生成、扩散模型(Diffusion)等任一方向有深入研究或工程实践。 

3. 具备极强的数据敏感度,能够处理 PB 级视频数据并从中挖掘关键特征与规律。   


【数据实习生 - 预训练&SFT视频数据工程】 

- 岗位职责: 

1. 构建高质量视频数据集,涵盖精细化动作描述(Dense Captioning)、多轮视频对话、视频推理(Reasoning)及长视频摘要数据。 

2. 优化视频数据处理流水线,包括视频去重、切片、抽帧策略及自动化标注体系(基于 LLM/VLM 的数据打标与清洗)。

3. 探索视频-音频-文本多模态数据的融合配比策略,提升模型在真实世界场景下的鲁棒性。

- 要求:

1. 具备优秀的数据敏感度,熟悉常用的视频处理工具。 

2. 有大规模 Web 视频数据清洗或多模态指令微调数据构建经验者优先。 


欢迎携简历私戳,注明【姓名-学校-实习/北斗-视频方向】,期待你的加入!

联系邮箱:liyanjie14@meituan.com 

 最后修改于2026-02-25 21:28:25
  • 发表于2026-02-25 21:17:25
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入