【急招-实习/校招-大模型】智谱AI算法研究员/工程师 - 实习(Intern)版 - 北大未名BBS
返回本版
1
/ 1
跳转

【急招-实习/校招-大模型】智谱AI算法研究员/工程师

[复制链接]
楼主

mooncakes [离线]

mooncake

2.8一般站友

发帖数:126 原创分:0
<只看ta> <ASCIIArt>
1楼

组内直推~氛围好~流程快~欢迎来投


公司介绍

以“让机器像人一样思考”为愿景,智谱致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构,2023年推出千亿基座对话模型ChatGLM并两次升级,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。目前,智谱开源模型系列全球累计下载量超过1700万,并入选Hugging Face平台较为欢迎的开源机构。

 

2024年1月,智谱推出新一代基座大模型GLM-4整体性能相比上一代大幅提升,比肩世界先进水平。6月,智谱发布了GLM-4-9B开源模型,支持多达100万Tokens的长文本和26种语言,并首次开源了基于 GLM 的视觉模型 GLM-4V-9B,其多模态能力比肩 GPT-4V。7月,AI 生视频「清影」发布并上线智谱清言APP,30秒将任意文图生成视频。发布 6 天,「清影」生成视频数突破百万量级。8月,在KDD大会上发布了新一代GLM-4-Plus,并在清言APP上线视频通话功能。

 

基于全自研基座大模型的强大能力,智谱打造了完整对标 OpenAI 的模型产品,包括 AI 提效助手智谱清言、高效率代码模型 CodeGeeX、多模态理解模型 CogVLM 和文生图模型 CogView 等。践行 Model as a Service(MaaS)市场理念,智谱 AI MaaS 平台提供开箱即用的 AI 应用开发资源和企业级模型解决方案,全方位赋能企业和开发者构建更智能的 AI 产品,打造高效率、通用化的“模型即服务”AI 开发新范式。智谱 AI 致力于通过大模型链接物理世界的亿级用户为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。


岗位1-大模型评测-算法研究员/工程师 (实习/全职)

岗位职责:

对大模型进行全面、细致、准确、高效的评测,对模型能力深度分析,明确模型的现有优势与缺陷,作为模型下一步发展的指路明灯。涉及当前几乎所有类型的主流大模型,包括但不限于通用对话、代码、图片/视频/语音理解与生成、长文本、Agent、角色扮演等。

1、探索可靠的LLM-as-a-Judge方法,在模型能力边界范围内最大化自动化评估的占比。

2、与预训练、Post-Training方向密切合作,构建准确、通用的Critic模型用于DPO、RL训练等。

3、完善与扩展评测的维度,挖掘已知模型能力之外的评测指标,探索未来模型方向。

4、参与搭建自动化、可扩展、可靠的评测系统,缩短评价周期,助力内部模型迭代。

5、构建评测的数据飞轮,实现线上数据获取-数据筛选分类-标注-模型迭代-评估的正向循环。

6、对大模型的安全性进行全方位评估和提升能力,研究大模型超级对齐的前瞻性技术。

7、参与撰写技术文档和学术论文,包括并不限于基准设计、评测标准和研究进展等。

岗位要求:

1、熟悉Python/C++/Java等编程语言,良好的编码习惯和一定的工程能力。

2、扎实的机器学习和深度学习基础,熟悉NLP或大模型相关算法。

3、熟练使用主流深度学习框架(如PyTorch、TensorFlow)。

4、良好的沟通能力、团队合作精神以及较强的解决问题能力。

5、在ACL,NeurIPS,ICLR,EMNLP等人工智能顶级会议或期刊上发表过论文者优先。

6、有大模型评测、对齐、安全等相关经验者优先。


岗位2-大模型评测-算法工程化 (实习/全职)

岗位职责:

1. 设计并运行评估以测量模型的能力

2. 编写高效且清晰的代码构建评估流程

3. 构建对大模型的不同能力的评估环境(多模态, agent,function_call, coding)

4. 参与模型自动评测的整体架构设计和规划

5. 持续优化现有系统的性能和稳定性

6. 编写清晰、可维护的代码

 

职位要求:

1. 本科及以上学历,计算机科学或相关专业

2. 具备多语言的后端开发经验(python, Go, Javascript 等)

3. 具备在高并发、高可用性系统中工作的经验

4. 对新技术和趋势保持热情和好奇心,愿意不断学习和适应

5. 良好的团队合作能力和沟通技巧

 

优秀的候选人可能还具备以下条件:

1. 能够跳出常规思维,为范围不明确的问题找到解决方案

2. 能够总结结果,在日常工作过程中发现问题,总结,改进模型能力

3. 有评估大模型的经验或者搭建过大模型系统经验


实习/校招投递:


 最后修改于2024-11-06 23:35:03
  • 发表于2024-11-05 15:33:05
楼主

mooncakes [离线]

mooncake

2.8一般站友

发帖数:126 原创分:0
<只看ta> <ASCIIArt>
2楼

组内直推~氛围好~欢迎来投

mooncakes (mooncake) 在 ta 的帖子中提到:

公司介绍

以“让机器像人一样思考”为愿景,智谱致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构,2023年推出千亿基座对话模型ChatGLM并两次升级,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。目前,智谱开源模型系列全球累计下载量超过1700万,并入选Hugging Face平台较为欢迎的开源机构。

 

……

发表于2024-11-06 23:30:53
返回本版
1
/ 1
跳转

请您先 登录 再进行发帖

快速回复楼主
标题
建议:≤ 24个字
签名档
发布(Ctrl+回车)

您输入的密码有误,请重新输入