阶跃星辰实习
[复制链接] 浏览该主题帖【实习】stepfun Agent RL 算法研究员
【岗位职责】
1. RL-enhanced LLM Agent:结合强化学习环境,构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。
2. Multi-Agent systems:研究多个智能体如何高效协作,以完成超越单个智能体能力范围的任务。
3. Omni-LLM-based Agent:开发融合文本、语音、图像多模态的智能体。
4. World Model:探索AI系统如何构建自身与外部世界的认知与期望模型。
5. 数据迭代流程优化:深入理解数据需求,推动人机协同的数据迭代流程,实现从人工到半自动化再到自动化的转变。
【岗位要求】
1. 教育背景:国内外高校研究生在读,具备良好的计算机或数学基础,拥有较强的编码能力。
2. 技术背景:具有LLM(大语言模型)、强化学习、推理模型等相关背景,熟悉主流大语言模型的算法架构。
3. 对齐方法:了解Alignment领域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求:具备卓越的实验分析与问题解决能力,拥有创新思维,能够进行良好的沟通,并与团队成员高效协作。
5. 实习时间:一周三天以上,实习时间3个月以上
【加分项】
1. 深度学习基础:具备深度学习、机器学习的基础知识,熟悉有监督学习、自监督学习等基本训练范式。
2. 项目经验:在大语言模型方面有开源项目经验者优先,或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。
3. 竞赛奖项:在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。
4. 学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先
【实习】stepfun Agent算法工程师
【岗位职责】
1. 设计agent memory;
2. Agent learning;
3. 深入理解数据需求,推动人工/半自动化/自动化数据迭代流程;
4. 建立评测体系,通过提示词、模型训练算法进行调快速调优;
【岗位要求】
1. 国内外高校研究生在读,具有良好的计算机/数学基础,有较强的编码能力;
2. 熟悉大语言模型的算法架构,包括Dense、MoE主流架构算法;
3. 了解 Alignment 领域的常用方法,包括但不限于 SFT、RFT、Actor-Critic 等 ;
4. 具备卓越的实验分析与问题解决能力,有创新思维,能够良好沟通、与团队成员高效协作。
【加分项】
1. 有深度学习,机器学习基础知识,熟悉有监督/自监督等基本训练范式;
2. 大语言模型方面开源项目经验者优先,或通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。
3. 学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先
有意联系:hatcher@stepfun.com 或 wx: Luminous991117
