【实习】【微软】大模型研究实习生
[复制链接] 浏览该主题帖
<ASCIIArt>
#61738
【我们】我们是DKI(Data Knowledge Intelligence) LLM research team。LLM training方面我们推出了warriorCoder, AgentGEN, wizardLM,wizardCoder, wizardMath等多个SOTA大模型;Agent方面我们推出了taskwaver, UFO等工作。小组发表过多篇引用量还可以的顶会论文(有oral也有best paper)并被多家媒体报道。
【方向】:
1,RL based post training,研究使用RL来提升LLM的coding、math、agent等能力;
2,LLM+广告推荐;
3,agent 研究。
【要求】:有LLM training经验 / 有agent开发经验,有顶会论文。
【联系】:puzhao@microsoft.com
