架构

该架构基于 OpenTelemetry 和 Jaeger 技术栈,实现了分布式追踪的全生命周期管理。系统由数据采集、传输、存储、查询和可视化五个核心模块组成。

核心组件

  1. OpenTelemetry 系统

    • opentelemetry-operator
      一个集群级别的 Operator,负责部署和管理 otel-collector 组件,提供 OTel 自动注入能力。
    • otel-collector
      接收来自应用的追踪数据,对其进行过滤和批处理,然后转发给 jaeger-collector。
    • Tracing UI
      自研的可视化界面,集成了 jaeger-query API,支持多维度查询条件。
  2. Jaeger 系统

    • jaeger-operator
      部署和管理 jaeger-collector 及 jaeger-query 组件。
    • jaeger-collector
      接收 otel-collector 转发和处理后的追踪数据,进行格式转换,并写入 Elasticsearch。
    • jaeger-query
      提供追踪查询 API,支持包括 TraceID 和标签在内的多条件检索。
  3. 存储层

    • Elasticsearch
      一个分布式存储引擎,支持对海量 Span 数据的高效写入和检索。

数据流

  • 写入流程
    Application -> otel-collector -> jaeger-collector -> Elasticsearch

    应用通过 SDK 或自动注入生成 Span 数据,otel-collector 对数据进行规范化处理,随后由 jaeger-collector 持久化写入 Elasticsearch。

  • 查询流程
    User -> Tracing UI -> jaeger-query -> Elasticsearch

    用户通过 UI 提交查询条件,jaeger-query 从 Elasticsearch 中检索数据;UI 根据返回的数据进行可视化展示。