安装 Llama Stack
本文档介绍如何使用 Llama Stack Operator 在 Kubernetes 上安装和部署 Llama Stack Server。
上传 Operator
下载 Llama Stack Operator 安装包(例如 llama-stack-operator.alpha.ALL.xxxx.tgz)。
使用 violet 命令发布到平台仓库:
安装 Operator
-
进入 Alauda Container Platform 的
Administrator视图。 -
在左侧导航栏选择
Marketplace/Operator Hub。 -
在右侧面板找到
Alauda build of Llama Stack,点击Install。 -
保持所有参数默认,完成安装。
部署 Llama Stack Server
Operator 安装完成后,通过创建 LlamaStackDistribution 自定义资源来部署 Llama Stack Server:
注意: 请提前准备以下内容,否则分发可能无法变为 Ready 状态:
- Secret:在与 LLM API 令牌相同的命名空间中创建 Secret(例如
deepseek-api)。示例:kubectl create secret generic deepseek-api -n default --from-literal=token=<LLM_API_KEY>。- Storage Class:确保集群中存在
defaultStorage Class,否则 PVC 无法绑定,资源无法变为 Ready。
部署完成后,Llama Stack Server 将在集群内可用。访问 URL 显示在 status.serviceURL 中,例如: