首页版面好友提醒登录
返回实习版 同主题展开

【实习】【微软】大模型研究实习生

puzhaopu 2025-10-27 19:39:27
#62025

【实习】【微软】大模型研究实习生

【关于我们】我们是DKI(Data Knowledge Intelligence)LLM research team。LLM training方面我们推出了warriorCoder、AgentGEN、wizardLM、wizardCoder、wizardMath等多个SOTA大模型;Agent方面我们推出了taskwaver、UFO等工作。小组发表过多篇引用量还可以的顶会论文(有oral也有best paper)并被多家媒体报道。

【方向】:1,RL based post training,研究使用RL来提升LLM的coding、math、agent等能力;2,LLM+广告推荐;3,agent 研究。

【要求】:1,有LLM training经验 / 有agent研发经验/有搜广推经验;2,有顶会论文。

【联系】:puzhao@microsoft.com