定义MIG 允许一张高端 GPU 被切分成多个独立实例,每个实例拥有独立的计算、显存和故障隔离边界。它适合推理、开发测试和多租户共享场景。平台需要识别 MIG 实例,并把它纳入资源申请、调度、监控和计量体系。应用场景多用户共享高端 GPU推理服务资源隔离开发测试环境细粒度分配关联资源GPU 池化