安装 KServe
目录
前提条件必需的依赖项安装注意事项上传 Operator安装 Operator验证创建 KServe 实例验证Envoy Gateway 配置Envoy AI Gateway 配置KServe Gateway 配置GIE (gateway-api-inference-extension) 配置升级 Alauda Build of KServe验证前提条件
在安装 Alauda Build of KServe 之前,您需要确保已安装以下依赖项:
必需的依赖项
Alauda build of Envoy Gateway 已原生集成于 ACP 4.2 版本。对于运行较早版本(包括 ACP 4.0 和 4.1)的环境,请联系客户支持获取兼容性和安装指导。
安装注意事项
- 必需依赖项:安装 Alauda Build of KServe 之前,必须先安装所有必需依赖项。
- GIE 集成:GIE 默认随包启用。如果您的环境中已单独安装 GIE,请在 operator 配置中将
gie.builtIn设置为false以禁用内置安装。
上传 Operator
下载 Alauda Build of KServe Operator 安装包(例如 kserve-operator.ALL.xxxx.tgz)。
使用 violet 命令将其发布到平台仓库:
安装 Operator
在 管理员 视图中:
-
点击 Marketplace / OperatorHub。
-
在控制台顶部,从 Cluster 下拉列表中选择要安装 KServe Operator 的目标集群。
-
搜索并选择 Alauda Build of KServe,然后点击 Install。
将弹出 Install Alauda Build of KServe 窗口。
-
保持 Channel 不变。
-
检查 Version 是否与您要安装的 Alauda Build of KServe 版本匹配。
-
保持 Installation Location 不变,默认应为
kserve-operator。 -
选择 Manual 作为 Upgrade Strategy。
-
点击 Install。
验证
确认 Alauda Build of KServe 磁贴显示以下状态之一:
Installing:安装进行中;请等待状态变为Installed。Installed:安装完成。
创建 KServe 实例
Operator 安装完成后,创建一个 KServe 自定义资源以部署 KServe 实例。
切换到 YAML 视图,应用以下配置,并根据您的环境调整标注字段:
spec.namespace— 部署 KServe 组件的 Kubernetes 命名空间。默认值:kserve。global.clusterName— 平台中注册的集群名称。例如:business-1。global.deployFlavor—single-node表示非高可用,ha-cluster表示生产环境高可用。global.platformAddress— Alauda Container Platform 管理端点地址。例如:https://192.168.131.112。preset.GIE— 内置的 Gateway API 推理扩展,增强 AI 能力。详见 GIE Configuration。preset.envoy_ai_gateway— AI 专用网关,用于智能路由和策略执行。详见 Envoy AI Gateway Configuration。preset.envoy_gateway— 基于 Envoy 的底层网关基础设施。详见 Envoy Gateway Configuration。preset.kserve_gateway— KServe 推理服务的入口网关。详见 KServe Gateway Configuration。global.registry.address— 目标集群(global.clusterName)用于拉取 KServe 基础设施和运行时镜像的容器镜像仓库地址。例如:registry.alauda.cn:60070。kserve.controller.deploymentMode— 设置为Knative以启用无服务器特性(如零实例扩缩),或Standard以使用原生 Kubernetes 部署。kserve.controller.gateway.domain— 入口网关用于暴露推理服务端点的域名。使用泛域名,例如*.example.com。kserve.storage.caBundleConfigMapName— 存储连接所用 CA 证书的 ConfigMap 名称。
验证
检查 KServe 资源状态:
当状态显示 DEPLOYED: True 时,实例即已准备就绪。
Envoy Gateway 配置
Envoy AI Gateway 配置
KServe Gateway 配置
GIE (gateway-api-inference-extension) 配置
升级 Alauda Build of KServe
- 使用
violet工具上传新版本的 Alauda Build of KServe operator 包。 - 进入
Administrator->Marketplace->OperatorHub页面,找到 Alauda Build of KServe,点击 Confirm 应用新版本。
验证
升级后,确认 Alauda Build of KServe 磁贴显示为 Installed,并检查 KServe 实例状态: