由一个 global 集群 和一个或多个 workload 集群 组成。必须先升级 global 集群,之后才能升级任何 workload 集群。
本文档将引导您完成 global 集群的升级操作步骤。
如果 global 集群配置了 global DR(灾难恢复) 方案,请严格按照global DR 操作步骤执行。否则,请按照标准操作步骤执行。
将核心软件包复制到 global 集群的 任意控制平面节点。解压软件包并进入解压后的目录。
如果 global 集群使用 内置镜像仓库,运行:
如果 global 集群使用 外部镜像仓库,还需提供仓库地址:
如果计划在升级 global 集群时同时升级 Operator 和 Cluster Plugin,请提前将对应的软件包推送到对应集群的镜像仓库。 批量上传说明请参见一次性推送所有软件包。
上传镜像通常需要约 2 小时,具体时间取决于您的网络和磁盘性能。
如果您的平台配置了 global 灾难恢复(DR),请注意 备用 global 集群也需要上传镜像,请合理安排维护时间窗口。
使用 violet 向备用集群上传软件包时,必须指定参数 --dest-repo <备用集群的 VIP 地址>。
否则,软件包将上传到 主集群 的镜像仓库,导致备用集群无法安装或升级扩展。
同时,必须提供备用集群镜像仓库的认证信息或使用 --no-auth 参数。
有关 violet push 子命令的详细信息,请参阅上传软件包。
镜像上传完成后,运行以下命令启动升级流程:
等待脚本执行完成后再继续。功能组件 标签页的升级按钮大约需要 10–15 分钟 才会可用。之后,您可以按照以下升级说明升级 Operator 和 Cluster Plugin。
global 集群,打开其详情视图。在弹窗中查看可用的组件更新,确认后继续。
此步骤仅确保集群增强插件已安装。如果您发现该集群插件已安装,则无需操作。
进入 管理员 视图。
在左侧边栏点击 Marketplace > Cluster Plugins,选择 global 集群。
找到 Alauda Container Platform Cluster Enhancer 插件,点击 安装。
如果安装了 Service Mesh v1,请在升级 workload 集群前参考 文档。
按照常规 global DR 检查流程,确保 备用 global 集群 中的数据与 主 global 集群 保持一致。
若发现不一致,请先联系技术支持,再继续操作。
在 两个 集群上运行以下命令,确保没有 Machine 节点处于非运行状态:
若存在此类节点,请联系技术支持解决后再继续。
global 集群。在 备用集群 和 主集群 上均执行 上传镜像 步骤。
详情请参见标准操作步骤中的上传镜像。
需要访问 备用集群 的 Web 控制台以执行升级。
升级前,请确认备用集群的 ProductBase 资源中 spec.alternativeURLs 配置了集群 VIP。
如未配置,请更新为:
在 备用集群 上,按照标准操作步骤完成升级。
备用集群升级完成后,继续在 主集群 上执行标准操作步骤。
重新安装前,请确认端口 2379 已正确从两个 global 集群 VIP 转发到其控制平面节点。
重新安装步骤:
global 集群。验证安装:
运行以下命令检查同步状态:
输出说明:
"LOCAL ETCD missed keys:" – 表示这些键存在于 主集群,但在备用集群缺失。通常重启 Pod 后会自动恢复。"LOCAL ETCD surplus keys:" – 表示这些键存在于 备用集群,但主集群不存在。请与运维团队确认后再删除。