首页/术语表

术语表

多云管理、智算、算力调度等核心概念的标准定义。便于客户、工程师与生态伙伴对齐认知。

CMP(多云管理平台)

云管理

CMP 是企业统一纳管多个公有云、私有云、虚拟化资源的治理平台,覆盖从申请、审批、交付到运营分析的全生命周期。

查看完整定义 →

AIC(智算管理)

智算

AIC 是面向智算中心的统一管理平台,把 GPU/NPU 异构算力、AI 任务调度、资产运营整合在一个体系中。

查看完整定义 →

智算

智算

智算是"智能算力"的简称,特指支撑 AI 模型训练与推理的高性能算力(GPU、NPU、专用加速卡),区别于传统通用计算。

查看完整定义 →

多云管理

云管理

多云管理是企业在使用多个云平台(公有云 + 私有云 + 虚拟化)时,对资源、流程、成本、安全进行统一治理的能力。

查看完整定义 →

算力调度

算力

算力调度是把分散的 GPU/NPU/CPU 算力资源,按 AI 任务的优先级、资源需求、SLA 进行统一编排和分配的能力。

查看完整定义 →

GPU 池化

算力

GPU 池化是把物理 GPU 卡的算力解耦成可灵活分配的资源池,支持"一卡多任务"或"多卡组一虚拟卡"。

查看完整定义 →

NPU

硬件

NPU 是为神经网络计算专门设计的处理器,常见的国产 NPU 包括华为昇腾、寒武纪 MLU 等;CMP/AIC 平台需要支持 NPU 与 GPU 的统一调度。

查看完整定义 →

算力网络

产业政策

算力网络是国家"东数西算"工程提出的产业概念,目标是把分散在不同地区的算力资源通过网络打通,按需调度,让算力像水电一样流通。

查看完整定义 →

云运营

云管理

云运营是把云资源从技术平台变成可申请、可交付、可计量、可分析的持续服务体系。

查看完整定义 →

云管平台

云管理

云管平台是企业统一管理多种云资源、流程、服务和成本的管理平台。

查看完整定义 →

服务目录

云管理

服务目录把云资源、软件环境和运维能力包装成标准化服务,供用户按需申请。

查看完整定义 →

资源生命周期管理

云管理

资源生命周期管理覆盖资源从申请、创建、变更、续期到回收的全过程。

查看完整定义 →

计量计费

算力

计量计费是对资源用量进行统计、汇总、定价和账单生成的能力。

查看完整定义 →

成本分摊

云管理

成本分摊是把云资源或算力资源费用按组织、项目、应用或租户维度归集。

查看完整定义 →

FinOps

云管理

FinOps 是面向云资源成本、预算、优化和责任归属的运营方法。

查看完整定义 →

配额管理

算力

配额管理用于限制或分配不同组织、项目、租户可使用的资源上限。

查看完整定义 →

ITSM 集成

云管理

ITSM 集成是把云资源申请、审批、变更和工单流程接入企业既有 IT 服务管理体系。

查看完整定义 →

CMDB 集成

云管理

CMDB 集成用于把云资源、配置项和业务关系同步到企业配置管理数据库。

查看完整定义 →

混合云

云管理

混合云是企业同时使用私有云、公有云和本地资源,并进行统一管理的架构模式。

查看完整定义 →

私有化部署

云管理

私有化部署是把软件部署在客户自有数据中心或专有云环境中,数据和系统由客户控制。

查看完整定义 →

智算中心

智算

智算中心是面向 AI 训练、推理和模型服务建设的算力基础设施与运营平台。

查看完整定义 →

异构算力

算力

异构算力是由 GPU、NPU、CPU、DCU 等不同芯片和资源形态共同组成的算力资源池。

查看完整定义 →

算力池化

算力

算力池化是把分散服务器上的计算资源抽象为统一资源池,供任务按需申请和调度。

查看完整定义 →

卡时

算力

卡时是智算场景常用的用量单位,表示一张加速卡被使用一小时。

查看完整定义 →

Token 计费

智算

Token 计费是按大模型输入和输出 Token 用量统计调用成本或使用额度的方式。

查看完整定义 →

多租户隔离

算力

多租户隔离用于保证不同组织、客户或项目在资源、权限、数据和账单上相互独立。

查看完整定义 →

模型网关

智算

模型网关是统一接入、鉴权、路由和观测多个大模型服务的入口层。

查看完整定义 →

训练任务调度

算力

训练任务调度是根据资源需求、优先级和队列策略为 AI 训练任务分配算力。

查看完整定义 →

推理服务

智算

推理服务是把训练好的模型部署成可被业务系统调用的在线服务。

查看完整定义 →

HPC 调度

算力

HPC 调度用于管理高性能计算作业队列、资源分配和批处理任务执行。

查看完整定义 →

Kubernetes GPU 调度

算力

Kubernetes GPU 调度是在 K8s 集群内为容器化 AI 任务分配 GPU 资源的机制。

查看完整定义 →

Volcano

算力

Volcano 是面向 Kubernetes 批处理和 AI/HPC 工作负载的开源调度系统。

查看完整定义 →

Kueue

算力

Kueue 是 Kubernetes 社区面向批处理、AI 和 HPC 工作负载的作业队列管理组件。

查看完整定义 →

Slurm

算力

Slurm 是 HPC 和科研计算场景常用的开源作业调度系统。

查看完整定义 →

PBS

算力

PBS 是高性能计算领域常见的批处理作业调度系统。

查看完整定义 →

MIG

硬件

MIG 是 NVIDIA 部分 GPU 支持的硬件级切分能力,可把一张 GPU 切分为多个隔离实例。

查看完整定义 →

vGPU

硬件

vGPU 是把物理 GPU 虚拟化后分配给多个虚拟机或工作负载的技术。

查看完整定义 →

RDMA

硬件

RDMA 是高性能网络通信技术,可降低多机训练和高性能计算中的网络延迟。

查看完整定义 →

NCCL

硬件

NCCL 是多 GPU 训练常用的通信库,用于提升分布式训练中的集合通信效率。

查看完整定义 →

智能体

智算

智能体是能够理解任务、调用工具、访问知识并按流程完成工作的 AI 应用形态。

查看完整定义 →

RAG

智算

RAG 是让大模型先检索企业知识,再基于检索结果生成答案的技术路径。

查看完整定义 →

知识库

智算

知识库是企业 AI 应用用于检索、问答和知识增强的内容底座。

查看完整定义 →

工具调用

智算

工具调用是让大模型按需调用外部 API、数据库或业务系统来完成任务的能力。

查看完整定义 →

工作流编排

智算

工作流编排是把多个模型、工具、判断节点和人工环节组合成可执行业务流程的能力。

查看完整定义 →