客户背景
上海市推进城市数字化转型,需要建设高性能公共算力中心,统筹全市公共算力资源。
多中心算力分散,AI 与 HPC 混合高负载场景对调度效率和运营能力提出要求。
建设挑战
- 多中心算力分散,跨域协同调度和统一编排难度高。
- 异构算力资源池需要统一抽象管理,提升算力供给效率。
- 平台需同时支撑大模型训练、科研并行等 AI/HPC 混合高负载场景。
解决方案
- 构建全域算力网络调度平台,连接多地节点,实现算力全局统一编排与调度。
- 支持 GPU、NPU 等底层异构算力纳管及跨资源池智能任务分发。
- 建设统一运营门户,覆盖算力资源态势感知、任务运行追踪与费用分析。
平台能力
跨域算力调度
连接多地算力节点,实现全局统一编排和任务分发。
异构资源纳管
统一纳管 GPU、NPU 等异构算力资源池。
任务运行追踪
跟踪算力任务运行状态和资源占用情况。
费用运营分析
支撑公共算力服务的费用分析和商业化运营。
实施成效
- 实现多地异构算力一体化调度与管理,提升公共算力供给统一管控能力。
- 支撑市级超大规模算力综合调度,增强科研与产业大模型承载力。
- 形成可持续扩展的公共算力商业化运营模式,提升超算平台综合服务价值。
常见问题
上海市公共算力服务平台案例主要解决了什么问题?
佳杰云星为上海市公共算力服务平台建设跨域协同调度平台,连接多地节点和异构算力资源池,实现公共算力统一编排、任务调度、资源态势感知和费用分析。
这个案例适合哪些企业参考?
适合人工智能、集团级 IT、行业云平台和存在类似资源统一管理、服务运营或算力调度需求的组织参考。
佳杰云星在这个案例中提供了哪些核心能力?
主要能力包括跨域算力调度、异构资源纳管、任务运行追踪、费用运营分析。
项目建设后带来了哪些价值?
实现多地异构算力一体化调度与管理,提升公共算力供给统一管控能力。 支撑市级超大规模算力综合调度,增强科研与产业大模型承载力。 形成可持续扩展的公共算力商业化运营模式,提升超算平台综合服务价值。
