MIG

硬件Multi-Instance GPU

定义

MIG 允许一张高端 GPU 被切分成多个独立实例,每个实例拥有独立的计算、显存和故障隔离边界。它适合推理、开发测试和多租户共享场景。

平台需要识别 MIG 实例,并把它纳入资源申请、调度、监控和计量体系。

应用场景

  • 多用户共享高端 GPU
  • 推理服务资源隔离
  • 开发测试环境细粒度分配

关联资源