最近更新时间:2024.03.22 18:25:26
首次发布时间:2023.09.04 11:07:31
弹性容器实例支持通过特定的 Annotation 指定实例规格族,同时指定resources.limits
的方式来创建 GPU 类型的 VCI 实例。
说明
创建 Pod 或者工作负载(包括 Deployment、StatefulSet、Job、CronJob)时,通过添加 Annotation,并指定resources.limits
方式来创建 GPU 类型的 VCI Pod。
Annotation 说明,如下所示。
Annotation Key | Annotation Value 示例值 | 说明 | 是否必填 |
---|---|---|---|
vci.vke.volcengine.com/preferred-instance-family | vci.ini2 | GPU 计算型 中的实例 规格族。 说明
| 本场景必填 |
vci.vke.volcengine.com/gpu-driver-version | tesla-470.129.06 | 指定 GPU 计算型实例的驱动版本。根据 说明 未设置该 Annotation 时,系统自动指定与您所选 GPU 计算型规格对应的默认驱动版本。 | 非必填 |
实例规格 | 支持的驱动版本 | 推荐的 CUDA 版本 |
---|---|---|
gni3 | 535.161.07(默认) |
注意 建议使用与驱动版本相匹配的 CUDA 版本,否则可能影响 GPU 性能。 |
gni2 |
| |
ini2 |
| |
g1v |
|
以创建 Pod 为例,完整的示例代码如下所示:
apiVersion: v1 kind: Pod metadata: name: demo-gpu-1 # Pod 名称。 namespace: default # Pod 所属命名空间。 annotations: vke.volcengine.com/burst-to-vci: enforce #强制使用 VCI。 vci.vke.volcengine.com/preferred-instance-family: vci.ini2 #指定实例的 GPU 规格族。 vci.vke.volcengine.com/gpu-driver-version: tesla-470.129.06 #指定实例的 GPU 驱动。 spec: containers: - image: cr-cn-beijing.volces.com/tw/nginx:1.0 # 容器镜像的地址和版本,请配置为您自己的镜像地址。 imagePullPolicy: Always name: nginx resources: requests: #指定容器的 vCPU、内存、GPU。 cpu: 37 nvidia.com/gpu: 2 #指定容器的 GPU 卡数(同原生),可以同时指定 limits 和 requests,但值必须相等。 limits: cpu: 37 nvidia.com/gpu: 2
说明
Pod.spec.container[].resources
的 GPU 设置,需与原生 Kubernetes 能力和限制相同:
<vendor>.com/gpu
指定 GPU 资源。limit
。limit
和request
,但值必须相等。rquest
,Kubernetes 默认将limit
值作为request
值。说明
VCI 场景中暂不支持使用 mGPU 资源类型。
vci.vke.volcengine.com/preferred-instance-family
,按需设置 Annotation Value 为您需要的 GPU 计算型 规格族。Pod.spec.container[].resources.limit.'<vendor>.com/gpu'
中的<vendor>
必须与实例规格族 GPU 对应的供应商一致。说明
当前 GPU 显卡为 NVIDIA 显卡。因此<vendor>
为nvidia
。
注意
合计数值小于规格数值时,将按规格数值创建实例和计费。若 Container 内指定的 GPU 数值小于规格数值可能会造成资源浪费,请合理规划实例规格。