近日,北京佳杰云星Rightcloud算力网络调度平台与华为云计算技术有限公司华为云公有云平台完成并通过华为云开发能力兼容性测试认证,获得 HUWEI COMPATIBLE 证书及认证徽标使用权。

Rightcloud算力网络调度平台是佳杰云星基于自身多年在算力运营领域的经验,自研的一款助力“东数西算”战略和实现跨区域异构算力资源(AI、HPC、云等)的调度、交易和协同的算力服务平台。能提供构建多元算力(容器、HPC、AI等算力)服务体系,实现异构算力环境统一管理、算力服务产品管理,价格管理,营销策略,销售分析,配额,信控等有着类公有云的体验的算力运营产品,能有效实现算力服务统一交易和售卖。

算力网络是“一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施”。如果将算力网络比作电网,算力就好比是电。在电力时代,有了以电网为载体的电,生产生活中的电器设备得以运转,在人工智能时代,有了以算力网络为基础的算力,人工智能才能运转。

图-1 AI算力未来5年有100倍增长

1

如今,算力已成为数字时代的重要生产力,服务于各行各业。如何提升算力利用效率,成为社会新的焦点。

市场层面,随着数字经济的发展,各行各业的数字化转型对算力产生巨大需求,与之相对的企业的私有数据中心、科研机构的超算中心闲置率很高,各类算力终端的利用率甚至低于15%。要解决算力供需失衡的问题,需要一个算力交易平台,搭建算力共享交易体系,而算力共享交易涉及到供给方、运营方、消费方三方,需要满足各参与方的诉求。

  • 算力供给方关心的是如何将自己闲置的算力变现,带来更大的价值;

  • 算力消费方关心的是如何找到自己想要的算力,随需随用;

  • 算力运营方关心的是如何聚合更多的算力,如何快速灵活满足各算力消费者的需求。

针对这些问题,需要构建一个算力运营体系,能够高效满足算力供需双方,将自有算力变现、让闲置的算力利用起来,让算力消费方方便、低成本获取到算力,聚合社会多方算力,满足算力消费方多样化业务需求,打造算力生态。

为吸引更多的社会算力加入,亟需构建多元供给方之间的算力网络交易与激励体系,一方面通过多方算网交易的建模和智能供需匹配,搭建算力消费者和算力供给方之间的交易桥梁,另一方面构建高效可靠的算网激励体系,基于历史交易行为实现良性交易循环,实现智能、公平、泛在、多方、可信的算力交易,形成社会多方算力、多层次能力共享的新商业模式。

图-2 AI“横向联网”需求:跨数据中心数据共享和算力互助

政策层面,自2020年以来,国家发布了以“新基建”为导向的一系列政策,旨在通过加快建设数字化基础设施,提升各行业的“联结+计算”能力,重塑产业升级模式。2021年5月,国家四部委发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出国家枢纽+省级+边缘节点的“东数西算”架构,打通网络传输,提升跨区域算力调度水平。这对算力网络也提出了迫切需求。

2

算力网络调度平台的核心价值

l 跨节点的算力协同调度有助于降本增效、节能减排

l 不同节点的预训练模型、数据集联网共享可提升效率

l 超大模型、联邦学习等重算力场景需要跨节点协同训练

在此背景下,北京佳杰云星基于多年云运营和管理的建设经验,围绕“东数西算”国家政策和算力网络战略和市场需求,构建算力门户,实现算力服务统一交易和售卖。通过与算力调度平台协同,打通算力交易全生命周期各环节,通过将算网原子化能力封装并融合多种要素,实现算网产品的一体化服务供给,使客户享受便捷的一站式服务和智能无感的体验。

图-3 北京佳杰云星算力网络平台架构

统一接入
支持高效接入多云异构算力,异构算力是指采用不同技术实现的计算能力,不同的技术包括不同的系统架构,不同的指令集,不同的技术类型,不同的计算能力提供方式,比如,X86架构、ARM架构、CPU、GPU、DPU、FPGA实现的计算芯片,专用硬件计算芯片等。平台可以接入各种异构算力以满足客户不同场景下的计算需求。

统一运营
依托统一运营平台,在物理上提供统一的服务入口,实现算网业务统一开通、统一计费。

统一计量
统一的度量标准,统一的描述方式,类似于统一的语言,有助于算力网络的各个网元之间高效协作。这时需要对算力也有一个方便的度量机制,这个机制一方面需要支持对用户的算力需求的描述,另一方面也需要支持对提供的算力资源的能力描述。

算力调度平台用户在各异构云、异构算力、异构网络等资源的使用计量数据统一采集管理,用户使用了多少资源一目了然。同时支持按量计费、包周期、资源包等多种灵活的计量计费方式。

统一调度

算力网络调度平台统一定时监控算力提供商提供的算力资源池资源分配以及使用状态,收集到的监控数据提供给调度算法用于指导调度决策。

用户通过算力调度平台使用多个AI计算中心的算力资源,算力调度平台根据应用服务的需求,综合考虑实时的网络和计算资源状况,将不同的应用调度到合适的计算节点处理,保证业务体验。

与此同时,北京佳杰云星致力于打造高效的算网运营交易平台,为用户提供随取随用的便捷服务。

3

算力网络是一种利用网络控制面传递算力等资源信息,并以此为基础实现多方、异构的计算、存储、网络等资源之间的信息关联与高频交易的技术体系,以满足新兴业务提出的“随时、随地、随需”的多样化需求,从而解决不同类型云计算节点规模建设后的算力分配与资源共享需求难题。

图-4 AI超算中心运营管理面临的挑战

完备的客户管理

企业为提高核心竞争力,算力运营方可利用算力运营平台的客户管理功能与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程。最终达到吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场。

异构算力快速开通

依托算网统一运营平台,在物理上提供统一的服务入口,实现算网业务统一开通、统一计费。客户在线在算力运营平台下单购买算力,算力资源自动开通,无需繁琐的线下审批流程。

便捷的智能调度

客户算力使用的便捷性需求对算力的灵活调度和使用带来了很大难度的挑战,一方面因为底层的算力分布和异构的特点,要为场景选择最合适的算力并调度到位,如 GPU 适合图形处理、NPU 适用人工智能;另一方面则因为算力的使用是与应用场景以及相应的平台或应用软件密切相关联的。算力网络调度平台通过连接和算力的全局优化,实现用户体验、资源利用率和网络效率的最优组合。