【实习】MiniMax General Agent RL 框架与算法研究 - 实习(Intern)版 - 北大未名BBS

【实习】MiniMax General Agent RL 框架与算法研究

[复制链接] 浏览该主题帖

hyn [离线]

wolai

2.3一般站友

发帖数:22 原创分:0
关注
<ASCIIArt> #62206

General Agent RL 框架与算法研究


职位描述

1. 参与面向真实环境(如 Claude Code、Codex等)的多智能体多轮强化学习。

2. 参与优化 General Agent RL 框架训练效率与算法上限。

3. 探索 LLM 持续学习(Continual Learning)等前沿算法。


职位要求

1. 熟悉 RL 算法的基本原理

2. 了解训推框架,如 Megatron、SGLang 等

3. 具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题


投递方式

yuelan@minimaxi.com

发表于2025-11-30 16:10:20

请您先 登录 再进行发帖

快捷回帖
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入