安装 Alauda Build of KServe
Alauda Build of KServe 是基于 KServe 构建的云原生组件,用于服务生成式 AI 模型。作为 Alauda AI 生态系统的扩展,它专门针对 大型语言模型(LLMs) 进行了优化,提供推理编排、流式响应和基于资源的生成式工作负载自动扩缩容等核心功能。
目录
先决条件必需依赖项可选依赖项安装说明下载 Cluster Plugin上传 Cluster Plugin安装 Alauda Build of KServeEnvoy Gateway 配置Envoy AI Gateway 配置KServe Gateway 配置GIE(gateway-api-inference-extension) 配置Alauda AI 集成升级 Alauda Build of KServe先决条件
在安装 Alauda Build of KServe 之前,您需要确保已安装以下依赖项:
必需依赖项
INFO
Alauda build of Envoy Gateway 已原生集成于 ACP 4.2 版本。对于运行早期版本(包括 ACP 4.0 和 4.1)的环境,请联系 Customer Support 获取兼容性和安装指导。
可选依赖项
安装说明
- 必需依赖项:安装 Alauda Build of KServe 前,必须先安装上述三个必需依赖项。
- GIE 集成:若需使用 GIE,可在安装过程中通过 Alauda Build of KServe UI 选择“Integrated GIE”选项启用。
- Alauda AI 集成:若不需要 KServe Predictive AI 功能,仅使用 LLM 生成式 AI,可在安装时禁用“Integrated With Alauda AI”选项。
下载 Cluster Plugin
INFO
Alauda Build of KServe 的 cluster plugin 可从 Customer Portal 获取。
详情请联系 Consumer Support。
上传 Cluster Plugin
有关上传 cluster plugin 的更多信息,请参见 Uploading Cluster Plugins
安装 Alauda Build of KServe
-
进入
Administrator->Marketplace->Cluster Plugin页面,切换至目标集群,然后部署Alauda Build of KServeCluster plugin。 -
在部署表单中,根据需要配置以下参数:
Envoy Gateway 配置
Envoy AI Gateway 配置
KServe Gateway 配置
GIE(gateway-api-inference-extension) 配置
Alauda AI 集成
-
点击 Install 开始安装过程。
-
验证结果。您可以在 UI 中看到状态为“Installed”。
升级 Alauda Build of KServe
- 上传新版 Alauda Build of KServe 插件包到 ACP。
- 进入
Administrator->Clusters->Target Cluster->Functional Components页面,点击Upgrade按钮,即可看到Alauda Build of KServe可升级。