安装 Alauda Build of KServe

Alauda Build of KServe 是基于 KServe 构建的云原生组件,用于服务生成式 AI 模型。作为 Alauda AI 生态系统的扩展,它专门针对 大型语言模型(LLMs) 进行了优化,提供推理编排、流式响应和基于资源的生成式工作负载自动扩缩容等核心功能。

先决条件

在安装 Alauda Build of KServe 之前,您需要确保已安装以下依赖项:

必需依赖项

依赖项类型描述
Alauda build of Envoy Gateway install_envoy_gateway_operatorOperator为 AI 服务提供底层网关功能
Envoy AI GatewayCluster Plugin提供 AI 专用的网关能力
Alauda Build of LeaderWorkerSetCluster Plugin为 AI 工作负载提供 leader-worker 集功能
INFO

Alauda build of Envoy Gateway 已原生集成于 ACP 4.2 版本。对于运行早期版本(包括 ACP 4.0 和 4.1)的环境,请联系 Customer Support 获取兼容性和安装指导。

可选依赖项

依赖项类型描述
GIE内置集成的 GIE(gateway-api-inference-extension)以增强 AI 能力。可通过 Alauda Build of KServe UI 启用。
Alauda AIOperator仅当需要使用 KServe Predictive AI 功能时才需要。若仅需 LLM 生成式 AI 功能,可禁用该项。

安装说明

  1. 必需依赖项:安装 Alauda Build of KServe 前,必须先安装上述三个必需依赖项。
  2. GIE 集成:若需使用 GIE,可在安装过程中通过 Alauda Build of KServe UI 选择“Integrated GIE”选项启用。
  3. Alauda AI 集成:若不需要 KServe Predictive AI 功能,仅使用 LLM 生成式 AI,可在安装时禁用“Integrated With Alauda AI”选项。

下载 Cluster Plugin

INFO

Alauda Build of KServe 的 cluster plugin 可从 Customer Portal 获取。

详情请联系 Consumer Support。

上传 Cluster Plugin

有关上传 cluster plugin 的更多信息,请参见 Uploading Cluster Plugins

安装 Alauda Build of KServe

  1. 进入 Administrator -> Marketplace -> Cluster Plugin 页面,切换至目标集群,然后部署 Alauda Build of KServe Cluster plugin。

  2. 在部署表单中,根据需要配置以下参数:

Envoy Gateway 配置

参数描述默认值
ServiceAccount NameEnvoy Gateway 使用的服务账户名称。envoy-gateway
ServiceAccount Namespace服务账户所在的命名空间。envoy-gateway-system
Create Instance创建 Envoy Gateway 实例以管理带有捆绑扩展的推理流量。Enabled
Instance Name要创建的 Envoy Gateway 实例名称。aieg

Envoy AI Gateway 配置

参数描述默认值
Service NameEnvoy AI Gateway 的 Kubernetes 服务名称。ai-gateway-controller
Port NumberEnvoy AI Gateway 使用的端口号。1063

KServe Gateway 配置

参数描述默认值
Enabled安装用于 inferenceservices 功能的 KServe Gateway 实例。Enabled
Gateway NameKServe Gateway 的名称。kserve-ingress-gateway
Gateway NamespaceKServe Gateway 部署所在的命名空间。kserve
GatewayClass可选。GatewayClass 的自定义名称。若留空,系统将自动按 "{Namespace}-{Name}" 模式推导。(Empty)
Port NumberKServe Gateway 使用的端口号。80

GIE(gateway-api-inference-extension) 配置

参数描述默认值
BuiltIn安装带有捆绑的 gateway-api-inference-extension v0.5.1 依赖以增强 AI 能力。Enabled

Alauda AI 集成

参数描述默认值
Integrated启用与 Alauda AI 核心插件的集成以复用现有配置。Disabled
  1. 点击 Install 开始安装过程。

  2. 验证结果。您可以在 UI 中看到状态为“Installed”。

升级 Alauda Build of KServe

  1. 上传新版 Alauda Build of KServe 插件包到 ACP。
  2. 进入 Administrator -> Clusters -> Target Cluster -> Functional Components 页面,点击 Upgrade 按钮,即可看到 Alauda Build of KServe 可升级。