岗位职责:
参与NPU编译器后端开发,负责算子调度、指令生成及内存分配优化;
研发AI模型(PyTorch/TensorFlow/ONNX)到NPU的部署工具链,包括模型量化、转换与运行时库优化;
开发自动化部署测试框架,持续提升编译器性能与稳定性;
与芯片设计、算法团队紧密配合,参与软硬件协同调优,充分发挥NPU能效优势。
任职要求:
硕士及以上学历,计算机、软件工程、人工智能、数学等相关专业;
熟练掌握C++/Python,有扎实的数据结构与算法基础;
了解编译器基础架构(LLVM/GCC/MLIR)或有AI框架(TVM/XLA等)使用经验者优先;
熟悉至少一种主流深度学习框架,对算子开发或计算图优化有认知;
有高性能计算、CUDA/OpenCL经验者加分,热衷于从底层释放硬件算力。