阿里巴巴通义万相招聘【社招/校招/实习】 - 实习(Intern)版 - 北大未名BBS

阿里巴巴通义万相招聘【社招/校招/实习】

[复制链接] 浏览该主题帖

Ai [离线]

大庚

该用户不存在
<ASCIIArt> #60209

我们是谁?

招聘部门:阿里巴巴通义实验室-万相团队

工作城市:杭州、北京

邮箱:zhaokang.zk@alibaba-inc.com


我们做什么?

视觉生成:文生图,文生视频,图生视频

视觉编辑:图片编辑,视频编辑

我们都做,尽在通义万相:https://tongyi.aliyun.com/wanxiang/


我们在今年2月开源了Wan2.1: https://github.com/Wan-Video/Wan2.1,是目前业界最能打的开源视频生成模型(之一);目前在VBench1.0上还是第一:https://huggingface.co/spaces/Vchitect/VBench_Leaderboard


我们要什么?

技术-算法-基础公共算法-基础模型

1.负责视频生成大模型的研发,重点提升模型效果,尺度定律的验证,不限于模型优化,训练优化,数据优化。

2.负责长上下文大模型训练,解决百万Tokens的有效和高效训练,能够生成高清长视频。

3.负责规模化图像和视频数据构建,能够清晰定义数据质量,规模化处理数据,度量数据质量。


技术-算法-基础公共算法-训练推理加速

1.负责视频生成大模型研发,重点解决视频生成模型的训练和推理效率问题。

2.负责研发各种无损推理加速算法,不限于cache、量化、采样优化等策略。

3.负责研发高效训练加速策略,不限于模型蒸馏,模型剪枝,attention计算近似等。


快到碗里来!

职位要求

1. 掌握机器学习和深度学习基础知识,熟悉常用视觉生成算法,熟悉Pytorch、Tensorflow等至少一种深度学习框架。

2. 极佳的工程实现能力,熟练掌握C/C++、Java、Python等至少一门语言 ,ACM/ICPC、topcoder等编程比赛获奖者优先。

3. 良好的科研能力,有成果发表在CVPR、ICCV、NeurIPS、ICLR、TPAMI等国际顶级会议、期刊者优先。

4. 对生成方向具有技术热情、良好的技术洞察力和优秀的业务分析能力,能应对复杂的业务算法需求。

发表于2025-04-07 22:36:47

请您先 登录 再进行发帖

快捷回帖
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入