卸载

卸载 Alauda 版本的 DCGM-Exporter

  1. 删除 MonitorDashboard 资源。
    kubectl -n cpaas-system delete MonitorDashboard hami-vgpu-metrics-dashboard

注意:如果 DCGM-Exporter 仅被 HAMi 使用,则可以卸载它。否则,只需更新集群插件配置并删除 gpu-on 节点标签。

  1. 进入 Administrator -> Marketplace -> Cluster Plugin 页面,切换到目标集群,找到 Alauda Build of DCGM-exporter,然后卸载该集群插件。

卸载 Alauda 版本的 Hami-WebUI

进入 Administrator -> Marketplace -> Cluster Plugin 页面,切换到目标集群,找到 Alauda Build of Hami-WebnUI,然后卸载该集群插件。

卸载 Alauda 版本的 Hami

  1. 删除 Hami 资源的 configmaps。

    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpualloc
    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpucores
    kubectl -n kube-public delete configmap cf-crl-hami-nvidia-gpumem
    kubectl -n kube-public delete configmap cf-crl-hami-config
  2. 进入 Administrator -> Marketplace -> Cluster Plugin 页面,切换到目标集群,找到 Alauda Build of Hami,然后卸载该集群插件。

  3. 移除 gpu 节点上的 "gpu=on" 标签:

    kubectl label nodes <nodeid> gpu-