使用 Kubeflow 卷

Kubeflow 中的卷作为 Kubernetes Persistent Volume Claims (PVCs) 进行管理。它们为你的数据、工作区和模型提供持久化存储，不受 Notebook servers 或其他工作负载生命周期的影响。

创建卷

访问监控面板：在 Kubeflow 中央监控面板侧边栏中单击 Volumes。
新建卷：单击 New Volume。
配置：
- Name：为该卷输入一个唯一名称。
- Storage Class：如果有多个可用的 Storage Class，请选择其一（例如，topolvm、nfs）。
- Size：以 Gi 为单位指定卷大小（例如，10）。
- Access Mode：
  - ReadWriteOnce (RWO)：由单个节点挂载（块存储常用）。
  - ReadWriteMany (RWX)：可由多个节点挂载（NFS/File 存储常用）。
创建：单击 Create。一旦完成配置，卷状态将变为 Bound。

管理卷

打开 PVC 视图：单击卷旁边的 "Folder" 图标，创建一个临时 Pod 来挂载该卷并打开文件浏览器。这样你就可以直接在卷中查看/上传/下载文件。完成后单击 "Close" 删除临时 Pod。
删除：单击卷旁边的删除图标（垃圾桶）将其移除。注意：这会永久删除数据。
筛选：使用搜索栏按名称、状态或 Storage Class 筛选卷。

在 Notebooks 中使用卷

要在 Notebook Server 中使用卷：

在创建 New Notebook 时，创建一个标准的 Workspace Volume（挂载到 /home/jovyan），或者...
滚动到 Data Volumes 以附加其他现有卷。
单击 Attach Existing Volume 并选择你的卷。
指定 Mount Path（例如，/home/jovyan/data）。

使用 Kubeflow KServe 端点

KServe Endpoints UI 允许你直接从 Kubeflow 监控面板部署、管理和监控机器学习模型的推理服务。

访问端点 UI

在中央监控面板侧边栏中单击 KServe Endpoints。
在页面顶部选择你的命名空间。
你将看到已部署的 InferenceServices 列表，以及它们的状态和 URL。

部署新模型

New Endpoint：单击 New Endpoint。
InferenceService YAML：
- 提供你的 InferenceService 的 YAML 定义。你可以将下面的示例 YAML 作为模板使用。

Deploy：单击 Create。

apiVersion: serving.kserve.io/v1beta1
kind: InferenceService
metadata:
  name: my-model
  namespace: my-namespace
spec:
  predictor:
    model:
      modelFormat:
        name: "transformers"
      runtime: aml-vllm-0.9.2-cuda-12.6
      storageUri: "hf://model-repo/model-name"

监控和测试

部署完成后，等待状态变为 Ready。

Inspect：单击模型名称以查看 YAML 详情和日志。
Get URL：复制提供的端点 URL（例如，http://model-name.namespace.svc.cluster.local/v1/models/model-name:predict 或外部 URL）。
Test：使用 curl 或 Python 客户端发送预测请求。

#使用 Kubeflow 卷

#目录

#创建卷

#管理卷

#在 Notebooks 中使用卷

#使用 Kubeflow KServe 端点

#访问端点 UI

#部署新模型

#监控和测试