在节点详情页查看节点监控数据。
当集群中节点数量超过 1 个时,可以点击节点详情页资源路径区域中的 当前节点名称,展开节点下拉列表,然后点击选择节点,快速切换到其他节点详情页。
当集群配置了监控组件时,可以查看节点监控数据,包括资源运行状态、资源使用情况和资源趋势统计。
在左侧导航栏,点击 Clusters > Clusters。
点击目标节点所在的 集群名称。
在 Nodes 标签页下,点击目标 节点名称。
点击 Monitoring 标签,进入节点监控数据展示页面,查看相关节点监控数据。
鼠标悬停在卡片上,点击 Details 图标查看 PromQL 表达式;点击 Export 图标导出当前页面所有图表的 PromQL 表达式。
当集群中节点数量超过 1 个时,可以点击节点详情页资源路径区域中的 当前节点名称,展开节点下拉列表,然后点击选择节点,快速切换到其他节点详情页。
在存储空间统计展示区域,当节点拥有超过 4 个存储分区时:
在分区总使用饼图中,使用率最高的前三个分区单独展示,其余分区合并显示为 Others,鼠标悬停时显示其总使用数据;
在分区使用柱状图中,使用率最高的前三个分区单独展示,其余分区合并显示为 Others,鼠标悬停时显示其总使用量及各自使用率。
监控趋势统计说明如下表。
| 参数 | 说明 |
|---|---|
| CPU | 指定时间范围内 CPU 的 使用率、请求率 和 限制率。 使用率 = 节点上所有 Pod 的 CPU 使用量 / 节点总 CPU。 注意:若节点 CPU 使用率在某段时间内出现峰值,需先定位消耗 CPU 资源最多的进程。例如,对于 Java 自定义应用,代码中的内存泄漏或死循环可能导致 CPU 使用率过高。 请求率 = 节点上所有 Pod 的 CPU 请求量 / 节点总 CPU。 注意:若节点 CPU 请求率在某段时间内出现峰值,可能是集群超额预订比例设置不合理或节点上运行的 Pod 请求值过高,导致资源浪费。 限制率 = 节点上所有 Pod 的 CPU 限制量 / 节点总 CPU。 注意:若节点 CPU 限制率在某段时间内出现峰值,说明节点上运行的 Pod 限制值设置过高,可能导致 CPU 资源浪费。 |
| Memory | 指定时间范围内内存的 使用率、请求率 和 限制率。 使用率 = 节点上所有 Pod 的内存使用量 / 节点总内存。 内存是服务器的重要组成部分,是 CPU 通信的桥梁,因此内存性能对机器影响显著。程序运行时,数据加载、线程并发和 I/O 缓冲均依赖内存。可用内存大小决定程序能否正常运行及运行效率。 请求率 = 节点上所有 Pod 的内存请求量 / 节点总内存。 注意:若节点内存请求率在某段时间内出现峰值,可能是集群超额预订比例设置不合理或节点上运行的 Pod 请求值过高,导致资源浪费。 限制率 = 节点上所有 Pod 的内存限制量 / 节点总内存。 注意:若节点内存限制率在某段时间内出现峰值,说明节点上运行的 Pod 限制值设置过高,可能导致内存资源浪费。 |
| Storage | 指定时间范围内的 空间使用率 和 inode 使用率。 空间使用率 = 已使用存储空间 / 总存储空间。 通过监控历史磁盘空间数据,可以评估某时间段内的磁盘使用情况。当磁盘使用率较高时,可以通过清理无用镜像或容器释放磁盘空间。 inode 使用率 = 已使用 inode / 总 inode 数量。 注意:每个文件必须有一个 inode 用于存储文件元数据,如文件创建者和创建日期。inode 也会占用磁盘空间,许多小缓存文件容易导致 inode 资源耗尽。此外,当 inode 耗尽但磁盘未满时,无法在磁盘上创建新文件。 |
| System Load | 1 分钟、5 分钟和 15 分钟的平均 CPU 负载。该值为当前 CPU 正在执行和等待执行的进程总数与 CPU 最大可执行进程数的比值,是系统繁忙/空闲状态的重要指标。 注意:若 1 分钟/5 分钟/15 分钟曲线在某段时间内相似,说明集群 CPU 负载较为稳定。 若某时间段或特定时间点 1 分钟值远大于 15 分钟值,说明最近 1 分钟负载上升,需持续观察。若 1 分钟值超过 CPU 数量,可能表示系统过载,需要进一步分析问题根因。 若某时间段或特定时间点 1 分钟值远小于 15 分钟值,说明最近 1 分钟系统负载下降,之前 15 分钟内负载较高。 |
| Disk Throughput | 指定时间范围内的磁盘吞吐量,指磁盘传输数据的速度,传输数据为读写数据之和。 |
| Disk IOPS | 指定时间范围内的磁盘 IOPS,即每秒连续读写操作次数之和,代表磁盘每秒读写操作的性能指标。 |
| Network Traffic Rate | 指定时间范围内的网络流入和流出速率,按节点物理网络接口统计。 |
| Network Packet Rate (packets/sec) | 指定时间范围内的网络包接收和发送速率,按节点物理网络接口统计。 |