定义
Computing Scheduling。在异构算力(不同型号 GPU、NPU、国产卡混合)规模化部署后,单一 K8s 调度器难以满足"按任务类型分配、按用户配额限制、按业务时段抢占"等需求。
算力调度系统在 K8s 之上增加智能调度层,识别任务特征(训练 vs 推理 vs 精调)、识别卡的能力(显存、互联带宽、拓扑),动态匹配最优算力组合。它是智算中心运营的"大脑"。
应用场景
- 千卡 GPU 集群:训练任务排队、抢占、断点续训
- 多租户智算中心:不同客户配额、SLA、计费分离
- 异构算力混部:H100/A800/昇腾 910/海光 DCU 统一池化
