字节跳动与北大“大模型数据运营挑战官”项目招募 - 兼职信息(ParttimeJob)版 - 北大未名BBS
返回本版
1
/ 1
跳转

字节跳动与北大“大模型数据运营挑战官”项目招募

[复制链接]
楼主

bookreadertt [离线]

赌输赢

4.8高级站友

发帖数:5530 原创分:0
<只看ta> <ASCIIArt>
1楼

字节跳动与北京大学“大模型数据运营挑战官”项目招募说明


一、项目说明

“大模型数据运营挑战官”是基于字节跳动大模型数据相关实战项目,面向北京大学在校学子提供的行业实践机会。同学可以基于自己的专业/爱好所长,在管理老师的指引下,在线承接字节跳动大模型项目的难题命题、竞赛题目解题、多家模型评测等具体项目,并在字节跳动验收后获得相应经济报酬。参与实践项目的优异表现者优先获得字节跳动内推实习机会。


二、任务描述

通用VideoICL(Video In-Context Learning)即“视频上下文学习”,强调让模型从视频中获取知识,并将获取的知识迁移到相关问题上。

学生要做的事:

1.从公开网站(B站、Youtube)找出限定领域的教学视频A(≤6个)和目标视频/图片B;

2.给模型出题并给出正确、唯一的答案,以及从A->B的思考过程;

【特别注意】

* 给模型出的题要确保:去掉教学视频A时,模型无法回答正确;

* 教学视频A的教学内容只通过视觉获得(模型无法听声音),因此所教学的知识需要有鲜明的视觉信息;需要带有字幕但学习内容不能仅凭字幕获得(答案不能直接读取自字幕);

* 目标视频/图片B是与教学视频A背景一致的应用场景,且教学视频A不能暴露答案或解题过程;

* 每道题必须包含至少4个有效选项,有效选项越多越好,单选正确答案;

* 要围绕教学视频A来撰写思考过程,不能出现知识错误、逻辑跳跃/错误和时间戳错误,需要严格做到时间戳对齐。如“教学视频1在25~30s提到…”

作业形式:线上平台


举个例子

教学视频A:你们怎么记住宝可梦的克制关系.mp4

目标图片B:可见pdf文档附件

(图片中左边是冰伊布Glaceon,右边是巴大蝶Butterfree,均出自《宝可梦》系列游戏)


问题:图中2个角色的克制关系是怎样的?

选项1:左边克制右边

选项2:右边克制左边

选项3:无克制关系

选项4:互相克制


三、人才需求

需求1:通用VideoICL项目

1.学历本科及以上,专业不限,有大模型数据集构建经验,有视频类数据构建经验;

2.熟悉B站、Youtube等视频网站,会使用插件下载视频(字节方会提供);

3.能简单使用剪映或其他剪辑软件,对视频进行长度裁剪或添加字幕;

4.书面表达流畅,理解能力较好,能灵活构造题目,对待数据认真负责;

5.能使用Gemini3或GPT5.2等多模态模型,能灵活利用提供的PE构造题目;

6.至少擅长这个文档中的某一个领域。


需求2:PresentationVideoICL项目

1.学历为985/211的硕士及以上,专业不限,在专业领域应当至少发表过一篇核心期刊的论文或顶会论文,有大模型数据集构建经验;

2.熟悉B站、Youtube等视频网站,会使用插件下载视频(字节方会提供);

3.能简单使用剪映或其他剪辑软件,对视频进行长度裁剪或添加字幕;

4.具备精准、无歧义的文字表达能力,语言组织规范流畅;拥有严谨的逻辑推导与结构化思维,能灵活构造题目,对待数据认真负责;

5.能使用Gemini3或GPT5.2等多模态模型帮助构造数据;

6.如果是STEM学科的学生,构造的数据解析过程涉及公式,需要熟悉markdown格式和latex公式;


四、项目薪酬

需求1:100元/小时(税前)

需求2:120元/小时(税前)


联系方式:

微信:bigstone_zhong

飞书:13810000845

发表于2026-03-10 13:37:45
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入