工作职责
1. 负责芯片SDK的架构设计和算法优化:
a) 跨量化、DSP部署和NPU部署的NNSDK,性能/效率/质量持续对标业界优秀芯片SDK;
b) 联合网络结构、量化和编译的优化算法设计和规划,效果持续对标业界SOTA;
2. 负责DSA架构NPU/DSP编译器工具链设计、开发和维护,实现对TensorFlow/PyTorch/Onnx等主流深度学习框架的支持;
3. 基于TVM/MLIR等开源框架做二次开发,实现编译器工具链中各种优化算法;
4. 开发AI算法模型高效算子,负责NN算法、图像算法在嵌入式异构平台上的实现;
5. 通过与相关领域(算法、芯片)的联合设计提升计算性能,并设计下一代AI编译器架构规范。
任职要求
1. 具备计算机科学、信息工程、电子工程、自动化等相关专业背景;
2. 有异构计算平台算法优化经验
对以下一种或多种异构计算硬件体系结构、并行计算有深入研究和实践经验:
a) 基于业界前沿AI加速器平台上算法性能优化经验;
b) 基于业界前沿GPU平台的算法性能优化经验,熟悉GPU架构编程;
c) ARM/x86等CPU上算法性能优化经验,熟悉多线程编程和内存管理技术;
3. 有AI编译器框架开发经验:
a) 熟悉TensorFlow/PyTorch/Onnx等主流深度学习框架;
b) 有基于TVM/MLIR等开源编译器开发经验;
c) 有NPU/DSP/GPU等异构计算平台开发和调优经验;
4. 熟悉C/C++以及python等编程语言,熟悉数据结构和软件设计模式。