从自定义命名的网卡采集网络数据

目录

场景描述

创建业务集群后,平台监控默认只能识别匹配 eth.*|en.*|wl.*|ww.* 等模式的网卡名称。对于用户自定义的网卡名称,监控页面无法查看网络流量数据。为此,平台支持修改相关资源参数,手动采集网卡流量数据。

操作步骤

  1. 登录 global 集群的控制节点,使用 kubectl 执行以下命令。

  2. 首先,在 global 集群中查找对应业务集群的 moduleinfo 资源名称:

    kubectl get moduleinfo | grep -E 'prometheus|victoriametrics'

    示例输出:

    global-6448ef7f7e5e3924c1629fad826372e7     global     prometheus          prometheus                          Running   v3.15.0-zz231204040711-9d1fc12474c2   v3.15.0-zz231204040711-9d1fc12474c2   v3.15.0-zz231204040711-9d1fc12474c2
    ovn-0954f21f0359720e8c115804376b3e7e        ovn        prometheus          prometheus                          Running   v3.15.0-zz231204040711-9d1fc12474c2   v3.15.0-zz231204040711-9d1fc12474c2   v3.15.0-zz231204040711-9d1fc12474c2
  3. 编辑业务集群对应的 moduleinfo 资源,将 ovn-0954f21f0359720e8c115804376b3e7e 替换为上一步查询到的业务集群 moduleinfo 资源名称:

    kubectl edit moduleinfo ovn-0954f21f0359720e8c115804376b3e7e
  4. 添加 valuesOverride 字段,并根据注释信息修改字段和正则表达式:

    spec:
      valuesOverride: # 如果该字段不存在,需要在 spec 下添加 valuesOverride 字段及以下参数
        ait/chart-cpaas-monitor:
          ovn: # 替换为业务集群名称
            indicator:
              networkDevice: eth.*|em.*|en.*|wl.*|ww.*|[A-Z].*i|custom_interface # 将 custom_interface 替换为自定义正则表达式,确保正确匹配网卡名称
  5. 等待 10 分钟后,检查节点监控页面的网络相关图表,确认修改生效。