蔡浩宇大模型团队 Agent Eval RL 实习招聘
[复制链接] 分享:利益相关:公司是本人所在的公司,团队是本人密切合作的团队;
我们欢迎对于LLM Agentic 任务评测和强化学习感兴趣的同学来实习,获得工业界一线经验。
学弟学妹感兴趣的快来联系!
----------------------------------------------------------------------------------------------------------------------------
LLM Agent Eval / RL 实习生 from蔡浩宇大模型team
职位职责
• 参与 LLM Agent 相关评测体系的设计、实现与迭代,包括 benchmark、metrics、judge、rubric、harness 等模块
• 参与 RL 训练相关实验支持、结果分析与问题定位
• 协助建设评测与训练相关的数据处理、实验管理与分析流程
• 与数据、标注等团队协作,推动评测与训练闭环持续迭代
任职要求
• 计算机、人工智能、数学、统计等相关专业本科/硕士在读
• 具备扎实的编程能力,熟练使用 Python
• 对 LLM、Agent、Evaluation、RL 等方向有较强兴趣
• 具备良好的责任心、执行力、沟通能力与团队协作能力
• 在过往项目中参与较深,对关键设计、实现细节和实操过程有清晰理解
加分项
• 有 LLM / Agent eval、RL、benchmark、data pipeline 等相关项目经历
• 熟悉 PPO、reward modeling、model-as-judge、preference learning 等方向
• 具备较强的实验分析和工程落地能力
岗位亮点
• 研究与工程结合紧密,具备较大的探索空间和成长空间
• 计算资源充足
• 有竞争力的实习待遇
投递方式:ping.tao@mihoyo.com
