【实习】【微软】大模型研究实习生
[复制链接] 浏览该主题帖
<ASCIIArt>
#61895
【实习】【微软】大模型研究实习生
【关于我们】我们是DKI(Data Knowledge Intelligence)LLM research team。LLM training方面我们推出了warriorCoder、AgentGEN、wizardLM、wizardCoder、wizardMath等多个SOTA大模型;Agent方面我们推出了taskwaver、UFO等工作。小组发表过多篇引用量还可以的顶会论文(有oral也有best paper)并被多家媒体报道。
【方向】:1,RL based post training,研究使用RL来提升LLM的coding、math、agent等能力;2,LLM+广告推荐;3,agent 研究。
【要求】:1,有LLM training经验 / 有agent研发经验/有搜广推经验;2,有顶会论文。
【联系】:puzhao@microsoft.com
