运营平台
社区版
社区版
集群管理:提供异构裸金属服务器的统一纳管,支持节点管理、规格管理等。
监控告警:提供对集群、计算节点、GPU计算卡、NPU计算卡等资源进行统一监控,以及告警设置和告警通知。
租户管理:提供对平台内租户的管理功能,支持多租户场景,租户间的数据隔离。
镜像管理:提供镜像仓库功能,支持管理员上传公共镜像到平台内。
开发环境:提供Jupyterlab集成开发工具链以提升 AI 开发体验,支持创建单卡粒度实例。
资源计量:提供全体租户资源计量的统一管理,每小时生成计量数据,支持按租户、集群等实体信息查询。
配额管理:支持共享资源池配额控制,超出配额后将进入排队状态。允许运维管理人员限定资源配额,可对租户的资源数量和容量进行限制。