术语表
多云管理、智算、算力调度等核心概念的标准定义。便于客户、工程师与生态伙伴对齐认知。
CMP(多云管理平台)
云管理CMP 是企业统一纳管多个公有云、私有云、虚拟化资源的治理平台,覆盖从申请、审批、交付到运营分析的全生命周期。
查看完整定义 →AIC(智算管理)
智算AIC 是面向智算中心的统一管理平台,把 GPU/NPU 异构算力、AI 任务调度、资产运营整合在一个体系中。
查看完整定义 →智算
智算智算是"智能算力"的简称,特指支撑 AI 模型训练与推理的高性能算力(GPU、NPU、专用加速卡),区别于传统通用计算。
查看完整定义 →多云管理
云管理多云管理是企业在使用多个云平台(公有云 + 私有云 + 虚拟化)时,对资源、流程、成本、安全进行统一治理的能力。
查看完整定义 →算力调度
算力算力调度是把分散的 GPU/NPU/CPU 算力资源,按 AI 任务的优先级、资源需求、SLA 进行统一编排和分配的能力。
查看完整定义 →GPU 池化
算力GPU 池化是把物理 GPU 卡的算力解耦成可灵活分配的资源池,支持"一卡多任务"或"多卡组一虚拟卡"。
查看完整定义 →NPU
硬件NPU 是为神经网络计算专门设计的处理器,常见的国产 NPU 包括华为昇腾、寒武纪 MLU 等;CMP/AIC 平台需要支持 NPU 与 GPU 的统一调度。
查看完整定义 →算力网络
产业政策算力网络是国家"东数西算"工程提出的产业概念,目标是把分散在不同地区的算力资源通过网络打通,按需调度,让算力像水电一样流通。
查看完整定义 →云运营
云管理云运营是把云资源从技术平台变成可申请、可交付、可计量、可分析的持续服务体系。
查看完整定义 →云管平台
云管理云管平台是企业统一管理多种云资源、流程、服务和成本的管理平台。
查看完整定义 →服务目录
云管理服务目录把云资源、软件环境和运维能力包装成标准化服务,供用户按需申请。
查看完整定义 →资源生命周期管理
云管理资源生命周期管理覆盖资源从申请、创建、变更、续期到回收的全过程。
查看完整定义 →计量计费
算力计量计费是对资源用量进行统计、汇总、定价和账单生成的能力。
查看完整定义 →成本分摊
云管理成本分摊是把云资源或算力资源费用按组织、项目、应用或租户维度归集。
查看完整定义 →FinOps
云管理FinOps 是面向云资源成本、预算、优化和责任归属的运营方法。
查看完整定义 →配额管理
算力配额管理用于限制或分配不同组织、项目、租户可使用的资源上限。
查看完整定义 →ITSM 集成
云管理ITSM 集成是把云资源申请、审批、变更和工单流程接入企业既有 IT 服务管理体系。
查看完整定义 →CMDB 集成
云管理CMDB 集成用于把云资源、配置项和业务关系同步到企业配置管理数据库。
查看完整定义 →混合云
云管理混合云是企业同时使用私有云、公有云和本地资源,并进行统一管理的架构模式。
查看完整定义 →私有化部署
云管理私有化部署是把软件部署在客户自有数据中心或专有云环境中,数据和系统由客户控制。
查看完整定义 →智算中心
智算智算中心是面向 AI 训练、推理和模型服务建设的算力基础设施与运营平台。
查看完整定义 →异构算力
算力异构算力是由 GPU、NPU、CPU、DCU 等不同芯片和资源形态共同组成的算力资源池。
查看完整定义 →算力池化
算力算力池化是把分散服务器上的计算资源抽象为统一资源池,供任务按需申请和调度。
查看完整定义 →卡时
算力卡时是智算场景常用的用量单位,表示一张加速卡被使用一小时。
查看完整定义 →Token 计费
智算Token 计费是按大模型输入和输出 Token 用量统计调用成本或使用额度的方式。
查看完整定义 →多租户隔离
算力多租户隔离用于保证不同组织、客户或项目在资源、权限、数据和账单上相互独立。
查看完整定义 →模型网关
智算模型网关是统一接入、鉴权、路由和观测多个大模型服务的入口层。
查看完整定义 →训练任务调度
算力训练任务调度是根据资源需求、优先级和队列策略为 AI 训练任务分配算力。
查看完整定义 →推理服务
智算推理服务是把训练好的模型部署成可被业务系统调用的在线服务。
查看完整定义 →HPC 调度
算力HPC 调度用于管理高性能计算作业队列、资源分配和批处理任务执行。
查看完整定义 →Kubernetes GPU 调度
算力Kubernetes GPU 调度是在 K8s 集群内为容器化 AI 任务分配 GPU 资源的机制。
查看完整定义 →Volcano
算力Volcano 是面向 Kubernetes 批处理和 AI/HPC 工作负载的开源调度系统。
查看完整定义 →Kueue
算力Kueue 是 Kubernetes 社区面向批处理、AI 和 HPC 工作负载的作业队列管理组件。
查看完整定义 →Slurm
算力Slurm 是 HPC 和科研计算场景常用的开源作业调度系统。
查看完整定义 →PBS
算力PBS 是高性能计算领域常见的批处理作业调度系统。
查看完整定义 →MIG
硬件MIG 是 NVIDIA 部分 GPU 支持的硬件级切分能力,可把一张 GPU 切分为多个隔离实例。
查看完整定义 →vGPU
硬件vGPU 是把物理 GPU 虚拟化后分配给多个虚拟机或工作负载的技术。
查看完整定义 →RDMA
硬件RDMA 是高性能网络通信技术,可降低多机训练和高性能计算中的网络延迟。
查看完整定义 →NCCL
硬件NCCL 是多 GPU 训练常用的通信库,用于提升分布式训练中的集合通信效率。
查看完整定义 →智能体
智算智能体是能够理解任务、调用工具、访问知识并按流程完成工作的 AI 应用形态。
查看完整定义 →RAG
智算RAG 是让大模型先检索企业知识,再基于检索结果生成答案的技术路径。
查看完整定义 →知识库
智算知识库是企业 AI 应用用于检索、问答和知识增强的内容底座。
查看完整定义 →工具调用
智算工具调用是让大模型按需调用外部 API、数据库或业务系统来完成任务的能力。
查看完整定义 →工作流编排
智算工作流编排是把多个模型、工具、判断节点和人工环节组合成可执行业务流程的能力。
查看完整定义 →