Kueue

算力Kubernetes Kueue

定义

Kueue 关注作业是否可以准入、排队和占用资源,适用于批处理、训练和推理等工作负载。它可以帮助集群在资源有限时更有序地安排任务。

在生产级智算平台中,Kueue 通常需要结合多租户、计量和运营管理能力使用。

应用场景

  • 训练任务排队
  • 批处理任务准入控制
  • 共享集群资源治理

关联资源