【实习】百度大搜算法实习-生成式模型在搜索的落地
真实影响亿万用户的搜索体验
百度基础相关性团队是百度搜索最核心的团队之一,负责百度大搜全系统语义相关性,包括但不限于query分析、doc语义召回、query-doc语义相关性计算等。我们做的事情能真实影响全国乃至全世界用户的搜索体验,引领搜索技术变革,“让人们更便捷地获取信息”是我们的主旨。
我们的主要工作内容包括预训练优化、模型小型化、模型新结构建模、超大规模向量索引、索引模型联合学习、样本技术、信息抽取、多目标、文本生成、基础NLP技术、端到端搜索等。
现在,我们想邀请你一起来探索一些非常有意思的事情: 【生成式模型在搜索排序阶段的探索】(包括面向排序的LLM预训练、NLU-NLG联合建模、异构蒸馏、生成式rank等), 我们希望你:
1. 具备优秀的分析问题和解决问题的能力, 并且对解决具有挑战性的问题充满激情
2. 扎实的自然语言处理领域的理论知识和学习背景,并有一定的相关研究或项目经验
3. 掌握至少一种主流深度学习框架(PyTorch、TensorFlow、PaddlePaddle等),能够快速实现对应的功能与改进
4. 熟悉transformer类模型原理,最好有开源大模型的Pretrain/SFT/蒸馏等相关经验,如LLaMA, ChatGLM, BLOOM等。
请将你的简历发送到邮箱: liuwenge@baidu.com