NPU

硬件Neural Processing Unit / 神经网络处理单元

定义

Neural Processing Unit,神经网络处理单元。区别于通用 GPU,NPU 在芯片架构上针对张量运算和神经网络算子做了专门优化,在能效比、特定模型推理性能上往往优于 GPU。

在国内市场,NPU 主要代表是华为昇腾系列(910/910B/910C)、寒武纪思元(MLU290/370/590)、昆仑芯(P800)等国产芯片。智算管理平台的关键能力之一,是让 GPU 与 NPU 共存于同一资源池,按任务自动选择最优卡。

应用场景

  • 信创合规场景:必须使用国产芯片的政务/央国企智算中心
  • 推理优先场景:NPU 在大模型推理上的能效比优势
  • GPU 替代:在 NVIDIA 卡受限制时的国产化方案

关联资源