OpenTelemetry 流量指标

该平台提供了丰富的流量指标数据,支持用户从多个维度分析服务质量流量。

服务流量监控

查看服务流量质量

前提条件

该服务已注入 Java Agent,请参阅 添加服务 了解实现方式。

步骤

  1. 在左侧导航栏中,点击 Monitoring

  2. 选择要查看监控数据的服务和时间范围。

    注意:查询时间范围受 Prometheus 监控数据保留期限制。例如,如果监控数据最多保留 7 天,而设置的时间范围为最近 30 天,则统计数据仅覆盖 7 天。

  3. 点击相应的选项卡,查看服务的流量监控数据和 JVM 监控数据。

常规操作

  • 刷新数据:当前页面上的监控统计数据仅在页面打开时自动刷新一次。如需再次刷新,可使用以下两种方式:

    • 手动刷新:点击页面右下角的 手动刷新数据。

    • 设置自动刷新(默认关闭):点击 设置自动刷新数据的时间间隔。

  • 查看/设置图例:点击图表右上角的 ,展开监控图表中的图例。点击图例可隐藏/显示图表中对应的曲线。

  • 放大查看监控图表:点击图表右上角的 ,在弹窗中查看放大后的、更详细的监控图表。

监控数据说明

监控指标说明
平均响应时间查询时间范围内的平均响应时间(总响应时间/响应总次数)。
平均入/出站 RPS查询时间范围内入/出站 RPS(Requests Per Second)的平均值。
响应时间服务之间或服务内部的响应时间,显示为平均值、TP 50、TP 95、TP 99。
TP(Top Percentile)xx 表示 xx% 网络请求所需的最短时长,通常用于系统性能监控场景。
将鼠标悬停在曲线上,可查看某个时间段的响应时间。
入/出站 RPS查询时间范围内的入/出站流量总 RPS 以及错误入/出站流量 RPS。
RPS = 查询时间内的请求数 / 查询时长 (s)
入/出站流量查询时间范围内的入/出站请求总量,以及按 HTTP 返回码划分的流量占比(正常/2xx、3xx、4xx、5xx)。
将鼠标悬停在柱状图上,可查看各类别的流量占比。
客户端流量对比客户端 指向当前服务(上游服务)发起请求的客户端服务(下游服务)。客户端流量对比 会对不同客户端调用当前服务时的 响应时间入站 RPS 和入站 RPS 错误率(Error RPS/RPS)进行对比展示。

说明
- unknown client 指服务网格中调用当前服务且其流量未被 OpenTelemetry 管理的客户端集合(HTTP 协议)。
- 如果客户端属于当前命名空间,点击客户端名称旁边的 Trace 会跳转到 Trace 页面。