首页版面好友提醒登录
返回实习版 同主题展开

【实习】【微软】大模型研究实习生

puzhaopu 2025-09-17 17:13:07
#61738

【我们】我们是DKI(Data Knowledge Intelligence) LLM research team。LLM training方面我们推出了warriorCoder, AgentGEN, wizardLM,wizardCoder, wizardMath等多个SOTA大模型;Agent方面我们推出了taskwaver, UFO等工作。小组发表过多篇引用量还可以的顶会论文(有oral也有best paper)并被多家媒体报道。

【方向】:

1,RL based post training,研究使用RL来提升LLM的coding、math、agent等能力;

2,LLM+广告推荐;

3,agent 研究。 

【要求】:有LLM training经验 / 有agent开发经验,有顶会论文。

【联系】:puzhao@microsoft.com