术语表

CMP 是企业统一纳管多个公有云、私有云、虚拟化资源的治理平台，覆盖从申请、审批、交付到运营分析的全生命周期。

AIC（智算管理）

AIC 是面向智算中心的统一管理平台，把 GPU/NPU 异构算力、AI 任务调度、资产运营整合在一个体系中。

智算

智算是"智能算力"的简称，特指支撑 AI 模型训练与推理的高性能算力（GPU、NPU、专用加速卡），区别于传统通用计算。

多云管理

多云管理是企业在使用多个云平台（公有云 + 私有云 + 虚拟化）时，对资源、流程、成本、安全进行统一治理的能力。

算力调度

算力调度是把分散的 GPU/NPU/CPU 算力资源，按 AI 任务的优先级、资源需求、SLA 进行统一编排和分配的能力。

GPU 池化

GPU 池化是把物理 GPU 卡的算力解耦成可灵活分配的资源池，支持"一卡多任务"或"多卡组一虚拟卡"。

NPU

NPU 是为神经网络计算专门设计的处理器，常见的国产 NPU 包括华为昇腾、寒武纪 MLU 等；CMP/AIC 平台需要支持 NPU 与 GPU 的统一调度。

算力网络

产业政策

算力网络是国家"东数西算"工程提出的产业概念，目标是把分散在不同地区的算力资源通过网络打通，按需调度，让算力像水电一样流通。

云运营

云运营是把云资源从技术平台变成可申请、可交付、可计量、可分析的持续服务体系。

云管平台

云管平台是企业统一管理多种云资源、流程、服务和成本的管理平台。

服务目录

服务目录把云资源、软件环境和运维能力包装成标准化服务，供用户按需申请。

资源生命周期管理

资源生命周期管理覆盖资源从申请、创建、变更、续期到回收的全过程。

计量计费

计量计费是对资源用量进行统计、汇总、定价和账单生成的能力。

成本分摊

成本分摊是把云资源或算力资源费用按组织、项目、应用或租户维度归集。

FinOps

FinOps 是面向云资源成本、预算、优化和责任归属的运营方法。

配额管理

配额管理用于限制或分配不同组织、项目、租户可使用的资源上限。

ITSM 集成

ITSM 集成是把云资源申请、审批、变更和工单流程接入企业既有 IT 服务管理体系。

CMDB 集成

CMDB 集成用于把云资源、配置项和业务关系同步到企业配置管理数据库。

混合云

混合云是企业同时使用私有云、公有云和本地资源，并进行统一管理的架构模式。

私有化部署

私有化部署是把软件部署在客户自有数据中心或专有云环境中，数据和系统由客户控制。

智算中心

智算中心是面向 AI 训练、推理和模型服务建设的算力基础设施与运营平台。

异构算力

异构算力是由 GPU、NPU、CPU、DCU 等不同芯片和资源形态共同组成的算力资源池。

算力池化

算力池化是把分散服务器上的计算资源抽象为统一资源池，供任务按需申请和调度。

卡时

卡时是智算场景常用的用量单位，表示一张加速卡被使用一小时。

Token 计费

Token 计费是按大模型输入和输出 Token 用量统计调用成本或使用额度的方式。

多租户隔离

多租户隔离用于保证不同组织、客户或项目在资源、权限、数据和账单上相互独立。

模型网关

模型网关是统一接入、鉴权、路由和观测多个大模型服务的入口层。

训练任务调度

训练任务调度是根据资源需求、优先级和队列策略为 AI 训练任务分配算力。

推理服务

推理服务是把训练好的模型部署成可被业务系统调用的在线服务。

HPC 调度

HPC 调度用于管理高性能计算作业队列、资源分配和批处理任务执行。

Kubernetes GPU 调度

Kubernetes GPU 调度是在 K8s 集群内为容器化 AI 任务分配 GPU 资源的机制。

Volcano

Volcano 是面向 Kubernetes 批处理和 AI/HPC 工作负载的开源调度系统。

Kueue

Kueue 是 Kubernetes 社区面向批处理、AI 和 HPC 工作负载的作业队列管理组件。

Slurm

Slurm 是 HPC 和科研计算场景常用的开源作业调度系统。

PBS

PBS 是高性能计算领域常见的批处理作业调度系统。

MIG

MIG 是 NVIDIA 部分 GPU 支持的硬件级切分能力，可把一张 GPU 切分为多个隔离实例。

vGPU

vGPU 是把物理 GPU 虚拟化后分配给多个虚拟机或工作负载的技术。

RDMA

RDMA 是高性能网络通信技术，可降低多机训练和高性能计算中的网络延迟。

NCCL

NCCL 是多 GPU 训练常用的通信库，用于提升分布式训练中的集合通信效率。

智能体

智能体是能够理解任务、调用工具、访问知识并按流程完成工作的 AI 应用形态。

RAG

RAG 是让大模型先检索企业知识，再基于检索结果生成答案的技术路径。

知识库

知识库是企业 AI 应用用于检索、问答和知识增强的内容底座。

工具调用

工具调用是让大模型按需调用外部 API、数据库或业务系统来完成任务的能力。

工作流编排

工作流编排是把多个模型、工具、判断节点和人工环节组合成可执行业务流程的能力。