首页/术语表/配额管理

配额管理

算力Quota Management

定义

配额管理是多租户平台的基础能力。管理员可以为部门、项目、租户设置 CPU、内存、存储、GPU 卡数、卡时、Token 或模型调用次数等资源上限。

合理的配额可以防止单个团队过度占用资源,也能让资源交付更可控。

应用场景

  • 租户 GPU 卡数限制
  • 部门云主机数量控制
  • 模型服务 Token 额度控制

关联资源