卸载

卸载 Alauda 构建的 DCGM-Exporter

  1. 删除 MonitorDashboard 资源。
    kubectl -n cpaas-system delete MonitorDashboard hami-vgpu-metrics-dashboard

注意:如果 DCGM-Exporter 仅被 HAMi 使用,则可以卸载它。否则,只需更新集群插件配置并移除 gpu=on 节点标签。

  1. 前往 管理员 -> Marketplace -> 集群插件 页面,切换到目标集群,找到 Alauda Build of DCGM-exporter,然后卸载该集群插件。

卸载 Alauda 构建的 Hami-WebUI

前往 管理员 -> Marketplace -> 集群插件 页面,切换到目标集群,找到 Alauda Build of Hami-WebUI,然后卸载该集群插件。

卸载 Alauda 构建的 Hami

  1. 删除 Hami 资源的 ConfigMap。

    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpualloc
    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpucores
    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpumem
    kubectl -n kube-public delete configmap cf-crl-hami-config
  2. 前往 管理员 -> Marketplace -> 集群插件 页面,切换到目标集群,找到 Alauda Build of Hami,然后卸载该集群插件。

  3. 从 GPU 节点移除 gpu=on 标签:

    kubectl label nodes <nodeid> gpu-