模型仓库
模型仓库功能的核心定义是提供一个基于 Git 的版本控制存储系统,用于机器学习模型,使团队能够管理模型文件、跟踪版本,并在不同租户之间协作。它利用 Git LFS 进行大文件存储,并与 MLOps 工作流集成,以衔接模型开发和部署。
优势
Git 原生版本控制
- 通过 commits/branches/tags 跟踪模型变更,确保可复现性。
高速传输
- CLI/Notebook 上传可利用内网带宽。
跨租户共享
- 共享模型可在不同命名空间之间访问(例如,
public作为模型 Marketplace)。
无缝集成
- 可将模型直接从仓库部署到推理服务。
核心功能
模型仓库创建与删除
- 创建一个带有元数据(名称/描述/可见性)的空 Git 托管仓库。
- 在执行依赖检查后删除模型(例如,确保没有正在运行的推理服务)。
文件管理
- CLI/Git LFS
- 使用
git lfs track管理大文件(例如,*.bin、*.h5)。 - 示例:
- 使用
版本控制
- 分支
- 维护并行版本(例如,
experimental与main分支)。
- 维护并行版本(例如,
- 标签
- 通过 UI/CLI 标记发布版本(例如,
git tag -a v2.0 -m "Stable release")。
- 通过 UI/CLI 标记发布版本(例如,
- 元数据同步
- 自动从默认分支读取
README.md作为模型描述。
- 自动从默认分支读取
跨租户共享
- 共享模型
- 在创建时将可见性设置为 "Shared",以便进行跨租户访问。
- 公共 Marketplace
- 使用
public命名空间发布开源模型(例如,HuggingFace 转换版本)。
- 使用
与 MLOps 集成
- 可直接部署
- 通过带标签的模型版本一键启动推理服务。
- Notebook 集成
- 直接将模型拉取到 AML Notebooks 中进行测试:
技术说明
- Git LFS 要求
- 必须包含
.gitattributes以指定由 LFS 跟踪的文件(例如,*.zip filter=lfs diff=lfs merge=lfs)。
- 必须包含
- 默认分支规则
- 配置不正确的
README.md元数据可能会阻止推理服务部署。
- 配置不正确的
创建模型并上传模型文件
有关将模型文件上传到模型仓库的详细步骤,请参阅 Upload Models Using Notebook。