guest 个人主页 修改帐号 退出
puzhao [离线]
pu
2.5一般站友
【方向】:1,LLM post training,研究使用RL等技术来提升LLM的coding、math、agent等能力;2,LLM+广告推荐;3,agent 研究。 目前我们已经推出了warriorCoder, AgentGEN, wizardLM,wizardCoder, wizardMath等多个SOTA大模型,发表了多篇引用量还可以的顶会论文、并被多家媒体报道。
【要求】:有LLM training经验,有顶会论文。
【联系】:puzhao@microsoft.com
请您先 登录 再进行发帖
您输入的密码有误,请重新输入