You need to enable JavaScript to run this app.
导航

概述

最近更新时间2023.06.20 14:06:56

首次发布时间2022.03.30 21:49:30

镜像封装了程序运行所需的软件依赖项,在机器学习平台上开发代码、训练和部署模型都需要镜像提供运行环境。【镜像仓库】模块为用户提供了镜像的管理能力,支持用户对镜像做版本化管理、查看镜像详情、以不同类型的镜像作为基础镜像构建出自定义镜像。

相关概念
支持的镜像类型

机器学习平台支持用户使用多种类型的镜像。在控制台的界面上通过简单地选择预置 / 自定义镜像,或者填写公网镜像的 URL 即可创建出各种工作负载。

  • 预置镜像:平台为用户提供了丰富的预置镜像,包含了 Python、CUDA、PyTorch 以及其它常用的机器学习镜像,支持开箱即用。
  • 自定义镜像:该类镜像均存放在火山引擎镜像仓库(CR)中,用户既可以通过平台的【镜像中心】构建自定义镜像并推送到 CR 上,也可以将已有的镜像直接推送到 CR 上。两者的区别在于前者支持在平台中维护更多的说明信息,如镜像的概览说明、软件版本列表等。
  • 公网镜像:若用户的镜像存放在如 DockerHub、Azure ACR、AWS ECR 等支持公网访问的镜像仓库中,在创建工作负载时支持填写该镜像的 URL 直接拉取,而无需迁移到火山引擎。
    • 直接拉取公网镜像时有可能会因为公网不稳定导致拉取速度慢或拉取失败。
    • 对于公网上的镜像,支持让用户提供仓库的用户名和密钥(建议尽可能提供临时登录密钥,避免密钥泄露)拉取私有镜像。
通过命令行工具使用镜像

目前平台支持通过命令行工具提交训练任务,具体步骤可参考发起单机 / 分布式训练任务 - 命令行。下文重点说明在任务的 yaml 配置文件中如何声明需要的镜像,完整的 yaml 规范详见submit 指令的说明

  • 在 yaml 文件中配置 ImageUrl 关键字,用于表示镜像的 URL 地址。在平台上注册过的自定义镜像可以在详情页的【版本列表】中获取镜像的 URL,未注册过的镜像需要在火山引擎镜像仓库(CR)中获取对应的 URL。
  • 对于公网上的私有镜像需要额外配置 RegistryUsernameRegistryToken 的关键字,分别对应私有仓库的用户名和密钥(建议尽量填写临时密钥,避免信息泄露)。
    ...(省略其它配置项)
    
    # 镜像 URL 地址
    ImageUrl: <填写镜像的 URL 地址>
    
    # 当 ImageUrl 为私有仓库的镜像时需要填写仓库的用户名和密钥才能拉取镜像
    ImageCredential:
        RegistryUsername: <填写私有镜像仓库的用户名>
        RegistryToken:    <填写私有镜像仓库的密钥>
    
    ...(省略其它配置项)