Model Repository
模型仓库功能的核心定义是提供一个基于 Git 的版本控制存储系统,用于机器学习模型,支持团队管理模型文件、跟踪版本,并实现跨租户协作。它利用 Git LFS 进行大文件存储,并集成 MLOps 工作流,连接模型开发与部署。
目录
优势
Git 原生版本控制
- 通过提交/分支/标签跟踪模型变更,确保可复现性。
高速传输
- CLI/Notebook 上传利用内网带宽。
跨租户共享
- 共享模型可跨命名空间访问(例如
public作为模型 Marketplace)。
无缝集成
- 可直接从仓库部署模型到推理服务。
核心功能
模型仓库创建与删除
- 创建带有元数据(名称/描述/可见性)的空 Git 支持仓库。
- 删除模型前进行依赖检查(如确保无活跃推理服务)。
文件管理
- CLI/Git LFS
- 使用
git lfs track管理大文件(如*.bin、*.h5)。 - 示例:
- 使用
版本控制
- 分支管理
- 维护并行版本(如
experimental与main分支)。
- 维护并行版本(如
- 标签管理
- 通过 UI/CLI 标记发布版本(如
git tag -a v2.0 -m "Stable release")。
- 通过 UI/CLI 标记发布版本(如
- 元数据同步
- 自动读取默认分支的
README.md作为模型描述。
- 自动读取默认分支的
跨租户共享
- 共享模型
- 创建时设置可见性为“Shared”以支持跨租户访问。
- 公共 Marketplace
- 使用
public命名空间发布开源模型(如 HuggingFace 转换模型)。
- 使用
与 MLOps 集成
- 部署准备
- 一键从标签模型版本启动推理服务。
- Notebook 集成
- 直接拉取模型到 AML Notebooks 进行测试:
- 直接拉取模型到 AML Notebooks 进行测试:
技术说明
- Git LFS 要求
- 必须包含
.gitattributes指定 LFS 跟踪文件(如*.zip filter=lfs diff=lfs merge=lfs)。
- 必须包含
- 默认分支规则
README.md元数据配置错误可能阻止推理部署。
创建模型仓库
WARNING
开始之前,请确保系统已安装 Git 和 Git LFS。
$ git lfs version
第 1 步:克隆或初始化仓库
如果已有远程仓库,执行克隆。否则可在本地初始化新的 Git 仓库。
第 2 步:初始化 Git LFS
第 3 步:将模型文件复制到仓库目录(可选)
第 4 步:配置 Git LFS 跟踪模式(两种方式任选其一)
-
可主动创建
.gitattributes文件,指定需要跟踪的文件类型。 -
或使用 git lfs migrate 命令自动检查并迁移大文件。
-
选项一:通过
.gitattributes主动跟踪(推荐新项目)TIP如果仓库中已有文件需要被 Git LFS 跟踪,建议在提交
.gitattributes变更后执行以下命令,确保 Git 重新处理这些文件并转换为 LFS 指针:git add --renormalize .
-
选项二:使用 git lfs migrate 检查并迁移(推荐已有仓库或历史文件)
git lfs migrate命令可查找并迁移 Git 历史中已存在但未被 LFS 跟踪的大文件。此操作会重写历史,需与协作者协调。推送重写历史时建议使用--force-with-lease。TIP对于共享仓库:迁移前通知协作者,推送重写历史时使用:
git push --force-with-lease
第 5 步:添加、提交并推送
配置好 LFS 后,将文件添加到暂存区,提交并推送到远程仓库。