Re: 【通义】实习生招聘 - RL/Agent/Reasoning方向
持续招聘中~~
cyrdoco (cyrdoco) 在 ta 的帖子中提到:
【研究方向】
1. 强化学习关键技术研究(包括但不限于self evolution/critic, Outcome/process/preference reward model)
2. Search/Retrieval场景下的reasoning技术研究
……
本站规定,相同或相近内容的帖子一周内严禁在5个及5个以上讨论区内重复张贴,否则将受到禁言全站发文权限直至删除帐号的处罚。
多个id共同一文多发的,对参与多发的每个id按多发总数进行处罚
点击右上角“”分享该页面