安装
本节描述安装 global 集群的具体步骤。
本页记录的是传统操作系统安装路径。如果你的环境运行在不可变基础设施(Alauda OS on Huawei DCS、VMware vSphere 或 Huawei Cloud Stack)上,请改为参考 在不可变基础设施上安装 global 集群。
在开始安装之前,请确保你已完成前置检查、安装包下载与校验、节点预处理以及其他准备工作。
流程
上传并解压安装包
将 Core Package 安装包上传到 global 集群控制平面节点中的任意一台机器,并按照以下命令进行解压:
- 该机器将在
global集群安装完成后成为第一个控制平面节点。 - Core Package 解压后,至少需要 100GB 磁盘空间。请确保有足够的存储资源。
- 如果你已经下载了扩展,请先完成 ACP Core 的安装,然后按照 扩展 上传并安装它们。
启动安装程序
执行以下安装脚本以启动安装程序。安装程序成功启动后,命令行终端会输出 Web 控制台访问地址。
等待约 5 分钟后,你就可以在 PC 上使用浏览器访问安装程序提供的 Web 控制台。
请确保安装程序所在节点的 IP 地址和 8080 端口可正常访问,以便安装程序成功启动后能够顺利访问其提供的 Web 控制台。
IP Family
如果你计划创建 Single-stack Network IPv6 的 global 集群,则在启动安装程序时必须显式指定 --ip-family ipv6。如果不指定该参数,安装程序创建的 global 集群默认支持 Single-stack Network IPv4 和 Dual-stack Network。
参数配置
按照页面引导完成安装参数配置后,确认安装。
参数说明 提供了关键参数的详细说明。请仔细阅读并根据实际需求进行配置。
监控安装进度
确认参数后,安装程序将经历多个阶段。一个 3 节点 global 集群通常会在 30–60 分钟内完成;总耗时取决于节点硬件、网络吞吐量以及所选插件数量。
你将观察到的阶段
安装过程中的信号
如果 Web UI 看起来卡住了超过几分钟,请改为检查后端信号——Web UI 会轮询后端进度 API,因此可能会有延迟,但底层状态始终可以在安装节点上获取。
安装程序 log 会记录每个阶段的切换以及所有可重试错误。大多数瞬时错误会以 10 秒为间隔自动重试;持续性错误会保留在 log 中,并在 Web UI 中表现为某个阶段停滞。
验证安装成功
安装完成后,平台访问 URL 会显示在 Web UI 中。点击 访问 按钮打开平台,并确认可以成功登录。
接下来,在新 global 集群的一个控制平面节点上运行以下命令,以确认安装状态:
当满足以下条件时,说明安装健康:
- 所有
global集群节点均为Ready。 ClusterModule/global报告为健康阶段。- 每个 AppRelease 均处于非失败状态。
cpaas-system中的关键 Pod 处于Running或Completed状态。
安装产品文档插件
Alauda Container Platform Product Docs 插件用于在平台内访问产品文档。平台中的所有帮助链接都会跳转到该文档。如果未安装此插件,点击平台中的帮助链接将会产生 404 访问错误。
-
进入 管理员。
-
在左侧边栏中,点击 Marketplace > 集群插件,然后选择
global集群。 -
找到 Alauda Container Platform Product Docs 插件并点击 安装。
参数说明
常见卡点及排查位置
如果安装程序报告错误或看起来没有进展,请先从下表中的症状入手。表中列出的信号是首先需要查看的位置;在创建工单之前,请先收集这些输出,以便支持团队能够基于相同数据进行处理。
未在此列出的故障通常指向环境相关原因。请收集安装程序 log 和相关的 kubectl describe 输出,然后升级处理。
安装程序清理
通常情况下,安装完成后安装程序会被自动删除。如果安装 30 分钟后安装程序未自动删除,请在安装程序所在节点上执行以下命令,强制删除安装程序容器: