ALB 监控

术语

术语描述
ALB平台自研的第七层负载均衡器。

操作步骤

  1. 进入 管理员

  2. 在左侧导航栏,点击 运维中心 > 监控 > 监控面板

  3. 点击页面顶部的 集群,切换到要监控的集群。

  4. 点击页面右上角的 切换

  5. 通过以下两种方式进入 ALB 状态 监控面板:

    • 方式一:点击 container-platform 卡片,展开监控目录,然后点击 ALB 状态 名称进入监控面板。需要时可将该监控面板设置为主面板。

    • 方式二:在搜索框输入关键词(如 alb)进行搜索,然后点击 ALB 状态 名称进入监控面板。需要时可将该监控面板设置为主面板。

  6. 通过面板查看各项监控指标。

    • 选择要监控的命名空间:点击页面顶部的 namespace,选择要监控的命名空间,默认为全部,即监控所有命名空间。

    • 选择要监控的 ALB:点击页面顶部的 name,选择要监控的 ALB,默认为全部,即监控所有 ALB。

监控指标

展示所选 ALB 在 最近 5 分钟 内的总流量、资源使用情况、Ingress(入站规则)、HTTPRoute(HTTPRoute 类型的路由规则)和 Rule(既非 Ingress 也非 HTTPRoute 的规则)的监控指标。

注意:所有数据均为 最近 5 分钟 内采集的监控数据。

ALB 流量监控

监控指标描述
活动连接数所选 ALB 上的活动连接数。
每秒请求数所选 ALB 每秒接收的请求总数。
错误率所选 ALB 每秒发生的 4XX(如 404)和 5XX 错误请求的比例。
延迟所选 ALB 上请求的平均延迟。

ALB 资源使用

监控指标描述
CPU 使用率所选 ALB 的 CPU 使用率。
内存使用率所选 ALB 的内存使用率。
网络接收/发送所选 ALB 的网络 I/O 吞吐量。
磁盘读写速率所选 ALB 的磁盘 I/O 吞吐量。

Ingress、HTTPRoute、Rule 流量监控

监控指标描述
QPS(每秒查询数)所选 ALB 上 Ingress/HTTPRoute/Rule 每秒接收的请求数,默认单位为 req/s。
请求 BPS(每秒字节数)所选 ALB 上 Ingress/HTTPRoute/Rule 每秒接收请求的总字节数。
响应 BPS(每秒字节数)所选 ALB 上 Ingress/HTTPRoute/Rule 发送响应的总字节数。
错误率所选 ALB 上 Ingress/HTTPRoute/Rule 处理请求时发生错误的百分比。
P50、P90、P99所选 ALB 上请求的响应时间,具体为中位响应时间。表示 50%、90% 和 99% 的请求响应时间小于或等于该值。

注意:P50、P90 和 P99 的原理是将采集的数据从小到大排序,取第 50%、90% 和 99% 位置的数据值;因此,采集的 50%、90% 和 99% 的数据都低于该值。百分位数有助于分析数据分布并识别各种极端情况。
上游 P50、上游 P90、上游 P99上游服务的请求响应时间。表示发送到上游服务的请求中,50%、90% 和 99% 的响应时间小于或等于该值。