文件存储灾备
CephFS Mirror 是 Ceph 文件系统的一个功能,旨在实现不同 Ceph 集群之间的异步数据复制,从而提供跨集群的灾难恢复。其核心功能是以主备模式同步数据,确保当主集群发生故障时,备份集群能够快速接管服务。
WARNING
- CephFS Mirror 基于快照进行增量同步,默认快照间隔为每小时一次(可配置)。主备集群之间的差异数据通常是一个快照周期内写入的数据量。
- CephFS Mirror 仅提供底层存储数据的备份,无法处理 Kubernetes 资源的备份。请结合平台的 备份与恢复 功能对 PVC 和 PV 资源进行备份。
术语
备份配置
前提条件
- 准备两个适合部署 Alauda Container Platform (ACP) Storage 并使用 Ceph 的集群,分别为主集群和备集群,确保集群间网络互通。
- 两个集群使用的平台版本(v3.12 及以上)必须保持一致。
- 在主集群和备集群中分别创建分布式存储服务。
- 在主集群和备集群中创建同名的文件存储池。
操作步骤
在备集群启用文件存储池的镜像功能
在备集群的控制节点执行以下命令:
参数说明:
<fs-name>:文件存储池名称。
获取 Peer Token
该令牌是建立两个集群镜像连接的关键凭证。
在备集群的控制节点执行以下命令:
参数说明:
<fs-name>:文件存储池名称。
在主集群创建 Peer Secret
获取到备集群的 Peer Token 后,需要在主集群创建 Peer Secret。
在主集群的控制节点执行以下命令:
参数说明:
<token>:在步骤 2中获取的令牌。<fs-name>:文件存储池名称。
在主集群启用文件存储池的镜像功能
在主集群的控制节点执行以下命令:
参数说明:
在主集群部署 Mirror Daemon
Mirror Daemon 持续监控文件存储池(启用镜像)的数据变化,定期创建快照并将快照差异通过网络推送到备集群。
在主集群的控制节点执行以下命令:
故障切换
当主集群发生故障时,可以直接继续使用备集群中的 CephFS。
前提条件
主集群的 Kubernetes 资源已备份并恢复到备集群,包括 PVC、PV 以及应用的工作负载。