首页版面好友提醒登录
返回实习版 同主题展开

【实习】【微软】大模型研究实习生

puzhaopu 2025-10-11 15:14:45
#61895

【实习】【微软】大模型研究实习生


【关于我们】我们是DKI(Data Knowledge Intelligence)LLM research team。LLM training方面我们推出了warriorCoder、AgentGEN、wizardLM、wizardCoder、wizardMath等多个SOTA大模型;Agent方面我们推出了taskwaver、UFO等工作。小组发表过多篇引用量还可以的顶会论文(有oral也有best paper)并被多家媒体报道。


【方向】:1,RL based post training,研究使用RL来提升LLM的coding、math、agent等能力;2,LLM+广告推荐;3,agent 研究。 


【要求】:1,有LLM training经验 / 有agent研发经验/有搜广推经验;2,有顶会论文。


【联系】:puzhao@microsoft.com