首页/术语表/算力调度

算力调度

算力Computing Scheduling / AI Scheduling

定义

Computing Scheduling。在异构算力(不同型号 GPU、NPU、国产卡混合)规模化部署后,单一 K8s 调度器难以满足"按任务类型分配、按用户配额限制、按业务时段抢占"等需求。

算力调度系统在 K8s 之上增加智能调度层,识别任务特征(训练 vs 推理 vs 精调)、识别卡的能力(显存、互联带宽、拓扑),动态匹配最优算力组合。它是智算中心运营的"大脑"。

应用场景

  • 千卡 GPU 集群:训练任务排队、抢占、断点续训
  • 多租户智算中心:不同客户配额、SLA、计费分离
  • 异构算力混部:H100/A800/昇腾 910/海光 DCU 统一池化

关联资源