【实习】【微软】大模型研究实习生

[复制链接] 浏览该主题帖

puzhao [离线]

2.5一般站友

发帖数：51 原创分：0

关注

<ASCIIArt> #61738

【我们】我们是DKI（Data Knowledge Intelligence） LLM research team。LLM training方面我们推出了warriorCoder, AgentGEN, wizardLM，wizardCoder, wizardMath等多个SOTA大模型；Agent方面我们推出了taskwaver, UFO等工作。小组发表过多篇引用量还可以的顶会论文（有oral也有best paper）并被多家媒体报道。

【方向】：

1，RL based post training，研究使用RL来提升LLM的coding、math、agent等能力；

2，LLM+广告推荐；

3，agent 研究。

【要求】：有LLM training经验 / 有agent开发经验，有顶会论文。

【联系】：puzhao@microsoft.com

回帖
回信
转载
转寄
收入文集

发表于2025-09-17 17:13:07