guest 个人主页 修改帐号 退出
cyrdoco [离线]
cyrdoco
2.6一般站友
持续招聘中~~~~
cyrdoco (cyrdoco) 在 ta 的帖子中提到:
【研究方向】
1. 强化学习关键技术研究(包括但不限于self evolution/critic, Outcome/process/preference reward model, Agentic RL)
2. LLM Agent相关技术研究
……
请您先 登录 再进行发帖
您输入的密码有误,请重新输入