【实习】【正式员工】Qwen语音多模态暑期实习及正式 - 实习(Intern)版 - 北大未名BBS
返回本版
1
/ 1
跳转

【实习】【正式员工】Qwen语音多模态暑期实习及正式

[复制链接]
楼主

JxuthuA [离线]

SoulJxu

0.0没等级

发帖数:1 原创分:0
<ASCIIArt> 1楼

我目前是阿里达摩院通义千问语音组的负责人,博士毕业于清华叉院,博士期间发表论文详见主页https://jxu-thu.github.io/aboutmechinese/。我目前有研究以及业务上的需求,需要招语音多模态方向的同学以及歌声/音乐生成的同学,期望可以实习然后转正加入我们。我们组目前的代表作是 Qwen-Audio,是第一个大规模的取得全音频任务SOTA性能的Audio-Central的Chat模型。


我们目前招两个方面:

【Speech】语音与文本多模态Chat模型理解模型 (基于通义千问)

工作内容:主要是做语音多模态大模型,让ChatGpt这样的模型具有语音的感知和生成能力。

工作目标: 完成业务指标,效果好发表高质量论文。

对候选人的要求: 有一定的语音背景,主要需要有较强的执行力和代码能力。

【Speech】音乐生成/歌声生成

对候选人的要求: 有语音合成/歌声合成背景,有较强的执行力和代码能力。

实习生我都会手把手的带,从工程实践到论文写作,我相信在这这个过程你也一定能收获成长~。欢迎同学考虑我们这边。我们组可以base 北京/杭州。

目前两方面都准备只招一名同学,然后期望转正加入我们。

联系方式 [请直接发简历/个人介绍到我邮箱]: jxu3425@gmail.com

 最后修改于2024-04-23 13:46:29
  • 发表于2024-04-23 13:39:14
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入