【实习】腾讯WXG理解及语音合成项目实习生(广州)
[复制链接] 分享:🗓项目内容:基于长文本的内容理解及应用。应用场景涵盖:内容审稿、内容分析、流量策略、TTS合成等。
🚀成长空间:实习期间可以深度参与产品方案设计、运营策略调整、评测集构造、模型能力建设、效果评测等各个环节,让一起探索内容理解和消费的新可能性!
👬期待的你:小说/文学发烧友、创作者 or 参与过有声内容制作 or 对内容理解、数据评测、语音合成等方向感兴趣的同学,都欢迎来投!
📍base地:广州/北京(优先广州!!)
📮联系方式:
【内容理解-技术策略】【内容理解-内容运营】【数据评测方向】请将简历发送至mikohe@tencent.com
【AI语音合成-产品策略】【AI语音合成-技术策略】【AI语音合成-内容运营】请将简历发送至ciarali@tencent.com
-------------
【内容理解-技术策略】
岗位职责:
1. 以业务为导向,运用计算叙事学、文学计算等理论,搭建书籍内容理解与评估的质化维度体系,并建立可与之对齐的量化特征体系和特征提取AI流程。
2. 针对内容流行度、选题发现等命题,能够通过统计建模、因果推断、网络分析等方法开展专项分析,助力业务决策,并提出可行性数据策略进行落地;
3. 跟进国内外LLM前沿技术,运用Prompt engineering、RAG、微调等,从数据视角进行AI技术方案预研、快速实验进行小范围效果验证、离线或线上效果评测等。
岗位要求:
1. 有内容类产品相关数据科学、算法推荐、内容理解实习经历优先,能够实习三个月以上优先;
2. 计算机、统计学、计算语言学、数字人文(文学计算)、计算叙事等相关领域本科及以上学历,具备跨学科视野;
3. 敏锐的数据洞察力、严谨的逻辑思维能力和系统的分析总结能力;
4. 掌握文学理论(网络文学方向)、创意写作、剧作理论,或是网文/小说重度爱好者;
5. 熟练使用SQL/Hive语句,具备Hadoop、Spark等平台的海量数据处理经验,熟练使用Python/R的数据分析工具包,经典机器学习算法包;
6. 有实际使用LLM API或开源大模型(如Llama系列)构建应用的实践经验,熟练掌握Prompt engineering,有RAG、LLM Agent、微调的应用落地经验优先。
-----------
【内容理解-内容运营】
岗位职责:
以业务为导向,运用细读和远读等文学批评理论,搭建书籍内容理解与评估的质化维度体系,负责搭建高质量数据集。
岗位要求:
1.有内容类产品相关内容运营、产品策划实习经历优先,能够实习三个月以上优先;
2.中国现当代文学、创意写作、戏剧文学等相关领域本科及以上学历,具备跨学科视野;
3.熟悉目前各类AI模型内容理解、内容创作、翻译等内容类任务的相关技术和能力边界;
4.具备数据驱动意识、严谨的逻辑思维能力和系统的分析总结能力;
5.掌握文学理论(网络文学方向)、创意写作、剧作理论,或是网文/小说重度爱好者。
----------
【数据评测方向】
岗位职责:
1. 评测体系与流程建设:以业务为导向,搭建内容理解过程产物及终产物的评测体系。参与自动化评测框架的开发与迭代,制定标准化的评测方案与流程,确保评测的高效性与信度。
2. 评测集构建与管理:负责高质量评测数据集的设计、标注、处理,构建涵盖多场景、多维度的评测用例,为模型能力评估提供坚实的数据支撑。
3. 评测效果分析:负责测试数据的整理与分析,输出清晰、准确且具有业务洞察力的专业评测报告。协同算法开发团队,对badcase进行全链路跟踪、归因分析与修复验证,辅助方案迭代与效果提升。
4. 前沿技术探索与创新:持续跟踪大模型评测、Agent以及内容理解、文学计算等前沿领域的进展,探索创新评测方法论与分析技术。
岗位要求:
1. 有内容或语音类产品的AI评测经历优先,能够实习三个月以上优先;
2. 计算机、数学、统计学等相关理工科专业本科及以上学历,具备跨学科视野;
3. 敏锐的数据洞察力、严谨的逻辑思维能力和系统的分析总结能力;
4. 对文学理论(网络文学方向)、创意写作、剧作理论有一定了解,或是网文/小说重度爱好者;
5. 熟练使用SQL/Hive语句,熟练使用Python,具备优秀的代码规范与熟练度。
6. 熟悉PyTorch、Transformers等核心库,熟悉主流大模型及多模态技术的发展动态。有实际使用LLM API或开源大模型(如Llama、Qwen系列)构建应用的实践经验,熟练掌握Prompt engineering,有RAG、LLM Agent、微调的应用落地经验优先,了解大模型推理框架(如 VLLM、SGlang)或相关性能优化技术者更佳。
------------
【AI语音合成-产品策略】
岗位职责:
1.负责AI朗读方向的产品规划和需求定义;
2.与工程、算法及评测团队紧密合作,持续迭代产品功能,提升AI朗读的用户体验和满意度;
3.深入洞察用户需求,进行音色生成、克隆及tts技术的调研与竞品分析,挖掘创新机会点。
岗位要求:
1.有内容或语音类产品的实习经历优先,能够实习三个月以上优先;
2.熟悉语音识别、语义理解、语音合成等语音交互相关技术,掌握语音产品性能评估方法;
3.具备敏锐的用户感知力,对产品体验有极致追求,能够主动发现并解决问题;
4.对文学理论(网络文学方向)、创意写作、剧作理论有一定了解,或是网文/小说重度爱好者。
-----------------
【AI语音合成-技术策略】
岗位职责
1. 参与AI朗读相关的大语言模型(LLM)优化,及语音合成(TTS)相关模型调优;
2. 评测体系与流程建设:以业务为导向,搭建AI朗读过程产物及终产物的评测体系。参与自动化评测框架的开发与迭代,制定标准化的评测方案与流程,确保评测的高效性与信度。
3. 前沿技术探索与创新:持续跟踪大模型评测、Agent以及语音识别、语义理解、语音合成等前沿领域的进展。
岗位要求:
1.计算机科学或人工智能相关专业,硕士及以上学历,具备跨学科视野;
2.具有大语言模型的研究和开发经验者优先;
3.具备较好的工程能力,熟悉至少一种编程语言、一个深度学习框架的中高阶特性/接口,熟悉典型的性能优化、质量保证的方法;
4.对文学理论(网络文学方向)、创意写作、剧作理论有一定了解,或是网文/小说爱好者。
---------------
【AI语音合成-内容运营】
岗位职责:
1.参与AI朗读需求下的音色效果评估和音色评测体系搭建;
2.搭建书籍角色和适配音色的评估标注;
3.与工程、算法及评测团队紧密合作,持续迭代音色库的更新机制,提升音色的覆盖度和质量;
4.深入洞察用户需求,进行音色设计、音色克隆及tts技术的调研与竞品分析,挖掘创新机会点。
岗位要求:
1.播音与主持专业、录音艺术专业优先;有广播剧配音经验优先;
2.有内容或语音类产品的实习经历优先,能够实习三个月以上优先;
3.具备敏锐的内容sense、用户感知力,对产品体验有极致追求,能够主动发现并解决问题。
