岗位职责
1、负责公司广告精排、粗排、召回模型在线推理引擎开发和优化;
2、设计、实现包括图优化、算子融合、模型量化、模型压缩、异构硬件等在内的推理引擎优化技术;
3、基于云原生场景下,设计并实现包括多云GPU/CPU异构部署、弹性伸缩、基于模型的成本精细化控制;
4、对Transformer、Attention等模型进行深度优化,支撑在线性能和成本要求;
5、结合公司推广搜业务场景,结合离线训练向近线学习架构演进。
岗位要求
1、计算机、数学或相关专业本科及以上学历,3年以上互联网工作经验;
2、扎实的编程基础,熟练掌握C/C++,具备扎实的数学、数据结构和算法基础,熟悉常用设计模式;
3、熟悉大规模高并发处理、分布式存储、负载均衡等后端开发技术;
4、具有独立解决问题的能力,良好的团队合作意识和沟通能力,有较强的技术好奇心和自驱力,了解行业最佳实践
5、有以下一项或多项经验者优先
a. 有大型搜索/推荐/广告算法架构设计经验者优先;
b. 熟悉云原生架构、有多云商多异构部署经验者优先;
c. 熟悉CUDA、OpenCL、OpenMP等编程栈优先;
d. 熟悉Tensorflow、Pytorch等深度学习框架,有GPU稀疏算子开发和优化经验者优先;