/ 1
【实习】【26/27届】 (字节跳动】广告算法工程师-RL
[复制链接] 分享:
1楼
职位描述
我们作为穿山甲广告Ranking团队,团队使命是充分结合网盟场景,夯实基础算法和机制策略能力,同时面向未来,基于大模型等新技术重塑投放链路,不断突破广告变现效率天花板;base北京/上海/杭州。
1. 提升投放链路效率,包括算力/召回/粗排/精排/Calibration/创意样式优选以及漏斗一致性框架等全链路优化;
2. 在广告系统中实现前沿强化学习算法的落地应用,包括但不局限于LLM,Bidding,算力调度分配等
3. 夯实海量数据下的基础算法能力,包括AIGC/长序列/大规模图网络/大规模异构场景建模等;
4. 持续提升投放生态水平,提供冷启动/稳定性等长期问题的产品化解决方案;
5. 针对nobid/托管预算等自动化投放场景,利用模型/运筹优化不断提升跑量和前后端ROI。
职位要求
1. 本科及以上学历,计算机,人工智能,数学等相关专业,具备优秀的编码能力,扎实的数据结构和算法功底
2. 对强化学习及其应用有热情,了解 RL基本训练范式及其在推荐广告领域的应用,熟悉DQN,A3C,PPO,CQL等算法
3. 具备扎实的机器学习和强化学习基础,拥有强化学习模型的训练和优化能力,对reward shaping,EE探索平衡,分布偏移等问题有深入研究,有相关项目经验
4. 优秀的分析问题和解决问题的能力,对解决具有挑战性的业务问题充满激情
5. 加分项:在搜广推场景有丰富的深度模型/大模型/RL实践经验,或者客户生态/网盟竞价相关经验
鼓励长期的探索和研究,希望实习时间六个月以上,联系邮箱fandailei@bytedance.com
/ 1
