蔡浩宇大模型团队 Agent Eval RL 实习招聘

返回本版

/ 1

跳转

[复制链接]

楼主

Arbeiter [离线]

好好学习

发帖数：150 原创分：2

关注

<只看ta> <ASCIIArt>

1楼

利益相关：公司是本人所在的公司，团队是本人密切合作的团队；

我们欢迎对于LLM Agentic 任务评测和强化学习感兴趣的同学来实习，获得工业界一线经验。

学弟学妹感兴趣的快来联系！

----------------------------------------------------------------------------------------------------------------------------

LLM Agent Eval / RL 实习生 from蔡浩宇大模型team

职位职责

• 参与 LLM Agent 相关评测体系的设计、实现与迭代，包括 benchmark、metrics、judge、rubric、harness 等模块

• 参与 RL 训练相关实验支持、结果分析与问题定位

• 协助建设评测与训练相关的数据处理、实验管理与分析流程

• 与数据、标注等团队协作，推动评测与训练闭环持续迭代

任职要求

• 计算机、人工智能、数学、统计等相关专业本科/硕士在读

• 具备扎实的编程能力，熟练使用 Python

• 对 LLM、Agent、Evaluation、RL 等方向有较强兴趣

• 具备良好的责任心、执行力、沟通能力与团队协作能力

• 在过往项目中参与较深，对关键设计、实现细节和实操过程有清晰理解

加分项

• 有 LLM / Agent eval、RL、benchmark、data pipeline 等相关项目经历

• 熟悉 PPO、reward modeling、model-as-judge、preference learning 等方向

• 具备较强的实验分析和工程落地能力

岗位亮点

• 研究与工程结合紧密，具备较大的探索空间和成长空间

• 计算资源充足

• 有竞争力的实习待遇

投递方式：ping.tao@mihoyo.com

发表于2026-03-06 16:40:21

返回本版

/ 1

跳转