架构
目录
Inspection

Inspection 模块由平台组件 Courier 和监控组件共同提供,涉及以下业务流程:
- 创建 inspection 任务:平台向
global 集群提交 inspection 类型的 CR。
- 执行 inspection 任务:Courier 组件监控 inspection 类型 CR 的生成,并向各集群的监控组件查询与 inspection 相关的各类指标数据。
- 写入 inspection 结果:Courier 组件完成对各 inspection 项的评估后,将 inspection 结果写回对应的 inspection CR。
- 查看 inspection 结果:用户可通过平台查看 inspection 任务的状态和结果,数据来源于对应的 inspection CR。
Component Health Status

Component Health Status 由平台组件 Courier 和监控组件共同提供,涉及以下业务流程:
- 预定义组件监控列表:平台在
global 集群预定义了两类 CRD,用于定义需监控的组件列表及监控方式:
- ModuleHealth:定义需监控的组件及监控方式。
- ModuleHealthRecord:定义各集群对应组件的监控结果。
- 定期监控组件状态:Courier 会 watch ModuleHealth,检查指定功能,然后将 inspection 结果写入 ModuleHealth 和 ModuleHealthRecord 的 CR 资源。
- 组件状态判定:Courier 会请求 Kubernetes 和监控组件的数据,以判定组件的实际状态及存在的问题。
- Kubernetes:检查组件是否安装及组件副本数是否正常。
- Prometheus / VictoriaMetrics:基于各组件提供的指标,查询并判定组件是否能正常提供服务。
- 查看组件健康状态:用户可通过平台查看各组件的健康状态,数据来源于对应的 ModuleHealth 和 ModuleHealthRecord CR 资源。