异构通信架构师30k-50k · 16薪
江苏本科及以上3-5年
工作职责
岗位职责:
1.主导设计高性能、低延迟的异构通信库(如nccl/nvshmem,保整在GPGPU、AI加速器等异构硬件上的高效数据传输。
2.构建优化核心通信组件(集合通信,通信算法,通信协议等),优化GPU通信传输延迟,通信带宽利用率,设计高效集合通信算法,适配IB,nvswitch,sharp,pcie,shm等多种通信链路。
3.针对万卡级模型训练推理场景,定位内核执行热点,提出架构级改进方案
4.与硬件团队合作定义计算单元架构,驱动ISA(指令集架构)设计;与算法团队合作优化数据传输与集合通信性能。
任职资格
岗位要求:
1. 计算机科学、电子工程、数学等相关专业硕士及以上学历,8年以上系统级软件开发经验,其中至少5年专注异构计算领域。
2. 精通CUDA/ROCm/OpenCL等主流异构编程模型,深入理解nccl实现原理(如LL,LL128,simple,ring,tree等)。
3. 对现代GPGPU架构(如NVIDIA Ampere/AMD CDNA)有深入研究,熟悉SIMT执行模型、层级内存体系、硬件调度队列等核心机制。
4. 具备构建复杂系统的能力,熟练掌握C/C++/Rust,精通Linux内核模块、DMA、PCIe通信等底层开发技术。
加分项:
参与过国际开源异构计算项目(如nccl,uccl,PyTorch/XLA、TVM、Vulkan计算管线)并贡献核心代码。
有GPGPU/FPGA/ASIC等芯片厂商底层工具链开发经验,熟悉指令集模拟器(ISS)或性能建模工具。
发表过体系结构顶会(ISCA、MICRO、HPCA)论文或持有相关专利
工作地点
南京市, 郑州市, 天津市, 成都市, 青岛市, 北京市