【实习】【微软】大模型研究实习生
【方向】:1,LLM post training,研究使用RL等技术来提升LLM的coding、math、agent等能力;2,LLM+广告推荐;3,agent 研究。 目前我们已经推出了warriorCoder, AgentGEN, wizardLM,wizardCoder, wizardMath等多个SOTA大模型,发表了多篇引用量还可以的顶会论文、并被多家媒体报道。
【要求】:有LLM training经验,有顶会论文。
【联系】:puzhao@microsoft.com