字节跳动与北大“大模型数据运营挑战官”项目招募
[复制链接] 分享:字节跳动与北京大学“大模型数据运营挑战官”项目招募说明
一、项目说明
“大模型数据运营挑战官”是基于字节跳动大模型数据相关实战项目,面向北京大学在校学子提供的行业实践机会。同学可以基于自己的专业/爱好所长,在管理老师的指引下,在线承接字节跳动大模型项目的难题命题、竞赛题目解题、多家模型评测等具体项目,并在字节跳动验收后获得相应经济报酬。参与实践项目的优异表现者优先获得字节跳动内推实习机会。
二、任务描述
通用VideoICL(Video In-Context Learning)即“视频上下文学习”,强调让模型从视频中获取知识,并将获取的知识迁移到相关问题上。
学生要做的事:
1.从公开网站(B站、Youtube)找出限定领域的教学视频A(≤6个)和目标视频/图片B;
2.给模型出题并给出正确、唯一的答案,以及从A->B的思考过程;
【特别注意】
* 给模型出的题要确保:去掉教学视频A时,模型无法回答正确;
* 教学视频A的教学内容只通过视觉获得(模型无法听声音),因此所教学的知识需要有鲜明的视觉信息;需要带有字幕但学习内容不能仅凭字幕获得(答案不能直接读取自字幕);
* 目标视频/图片B是与教学视频A背景一致的应用场景,且教学视频A不能暴露答案或解题过程;
* 每道题必须包含至少4个有效选项,有效选项越多越好,单选正确答案;
* 要围绕教学视频A来撰写思考过程,不能出现知识错误、逻辑跳跃/错误和时间戳错误,需要严格做到时间戳对齐。如“教学视频1在25~30s提到…”
作业形式:线上平台
举个例子
教学视频A:你们怎么记住宝可梦的克制关系.mp4
目标图片B:可见pdf文档附件
(图片中左边是冰伊布Glaceon,右边是巴大蝶Butterfree,均出自《宝可梦》系列游戏)
问题:图中2个角色的克制关系是怎样的?
选项1:左边克制右边
选项2:右边克制左边
选项3:无克制关系
选项4:互相克制
三、人才需求
需求1:通用VideoICL项目
1.学历本科及以上,专业不限,有大模型数据集构建经验,有视频类数据构建经验;
2.熟悉B站、Youtube等视频网站,会使用插件下载视频(字节方会提供);
3.能简单使用剪映或其他剪辑软件,对视频进行长度裁剪或添加字幕;
4.书面表达流畅,理解能力较好,能灵活构造题目,对待数据认真负责;
5.能使用Gemini3或GPT5.2等多模态模型,能灵活利用提供的PE构造题目;
6.至少擅长这个文档中的某一个领域。
需求2:PresentationVideoICL项目
1.学历为985/211的硕士及以上,专业不限,在专业领域应当至少发表过一篇核心期刊的论文或顶会论文,有大模型数据集构建经验;
2.熟悉B站、Youtube等视频网站,会使用插件下载视频(字节方会提供);
3.能简单使用剪映或其他剪辑软件,对视频进行长度裁剪或添加字幕;
4.具备精准、无歧义的文字表达能力,语言组织规范流畅;拥有严谨的逻辑推导与结构化思维,能灵活构造题目,对待数据认真负责;
5.能使用Gemini3或GPT5.2等多模态模型帮助构造数据;
6.如果是STEM学科的学生,构造的数据解析过程涉及公式,需要熟悉markdown格式和latex公式;
四、项目薪酬
需求1:100元/小时(税前)
需求2:120元/小时(税前)
联系方式:
微信:bigstone_zhong
飞书:13810000845
