蔡浩宇大模型团队 Agent Eval RL 实习招聘 - 求职信息发布(Job_Post)版 - 北大未名BBS
返回本版
1
/ 1
跳转

蔡浩宇大模型团队 Agent Eval RL 实习招聘

[复制链接]
楼主

Arbeiter [离线]

好好学习

2.9一般站友

发帖数:150 原创分:2
<只看ta> <ASCIIArt>
1楼

利益相关:公司是本人所在的公司,团队是本人密切合作的团队;

我们欢迎对于LLM Agentic 任务评测和强化学习感兴趣的同学来实习,获得工业界一线经验。

学弟学妹感兴趣的快来联系!


----------------------------------------------------------------------------------------------------------------------------

LLM Agent Eval / RL 实习生   from蔡浩宇大模型team

 

职位职责

        •        参与 LLM Agent 相关评测体系的设计、实现与迭代,包括 benchmark、metrics、judge、rubric、harness 等模块

        •        参与 RL 训练相关实验支持、结果分析与问题定位

        •        协助建设评测与训练相关的数据处理、实验管理与分析流程

        •        与数据、标注等团队协作,推动评测与训练闭环持续迭代

 

任职要求

        •        计算机、人工智能、数学、统计等相关专业本科/硕士在读

        •        具备扎实的编程能力,熟练使用 Python

        •        对 LLM、Agent、Evaluation、RL 等方向有较强兴趣

        •        具备良好的责任心、执行力、沟通能力与团队协作能力

        •        在过往项目中参与较深,对关键设计、实现细节和实操过程有清晰理解

 

加分项

        •        有 LLM / Agent eval、RL、benchmark、data pipeline 等相关项目经历

        •        熟悉 PPO、reward modeling、model-as-judge、preference learning 等方向

        •        具备较强的实验分析和工程落地能力

 

岗位亮点

        •        研究与工程结合紧密,具备较大的探索空间和成长空间

        •        计算资源充足

        •        有竞争力的实习待遇

 

投递方式:ping.tao@mihoyo.com

发表于2026-03-06 16:40:21
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入