AI 数据湖服务 LAS 产品提供了基于不同框架、不同版本的官方内置镜像,同时支持灵活的自定义镜像功能,如在平台上基于开发机构建镜像的能力。您可以在使用开发机、任务提交时直接选择适合的镜像,即可快速构建 AI 开发环境或数据处理任务。
LAS 内镜像管理基于火山引擎镜像仓库进行构建,镜像仓库(Container Registry,CR)是火山引擎提供的安全高可用的容器镜像、Helm Chart 等符合 OCI 标准的云原生制品托管服务,方便用户对符合 OCI 标准的云原生制品进行全生命周期管理,LAS 官方内置镜像以及用户自定义镜像都实际存储在镜像仓库中。
说明
如果该账号下未创建标准版的实例,可能联系具备相关权限如 CRFullAccess IAM 策略的用户前往 CR 的控制台页面创建。
镜像名称/ID | 镜像描述 | 框架 | 机型 | 镜像大小 | 镜像仓库地址 |
|---|---|---|---|---|---|
ve-daft | ve-Daft 是由火山引擎 LAS 团队推出的定制版 Daft,包含了 Daft 以及多模态算子相关的依赖以及运行环境,比如 Cuda、Conda、Ray 等。 | Daft | CPU、GPU | 16G | las-ai-cn-beijing.cr.volces.com/las/ve-daft:cu12.4.1-py3.11-0.5.8.post100 |
ray | Ray 是由火山引擎 EMR 团队推出的定制版 Ray Runtime,包含 Ray 及其所需依赖的镜像,内置有 Conda、Java8、Hadoop 服务。 | RAY | CPU、GPU | 7.45G | las-ai-online-cn-beijing.cr.volces.com/las/ray:2.44.0-cu12.2.2-py3.11-ubuntu22.04-493-3.15.1 |
spark | Spark 是由火山引擎 EMR 团队推出的定制版 Spark,包含 Spark 及其所需依赖的镜像,内置有 Java8、Hadoop 等服务。 | SPARK | CPU、GPU | 1.56G | las-ai-online-cn-beijing.cr.volces.com/las/spark:3.5.1-py3.12-ubuntu20.04-358 |
las-opensource-lib | 这是一个开源的预集成镜像,专为数据处理与机器学习任务设计,提供开箱即用的工具链(包括 Python 3.10、CUDA 12.6 和 Ubuntu 22.04),覆盖基础模型预训练数据清洗、音频特征工程以及 NLP/CV 模型微调与部署等场景,并优化了 CUDA 加速与分布式计算性能。 | — | CPU、GPU | 9.27G | las-ai-cn-beijing.cr.volces.com/las-ai/las-opensource-lib:0.2.1-py3.10-12.6.1-cudnn-devel-ubuntu22.04-18 |
LAS 镜像管理提供了灵活的自定义镜像功能,支持在平台上基于开发机构建新镜像,以满足数据处理需求,提升生产效率和操作便捷性。
分类 | 配置项 | 说明 |
|---|---|---|
基本信息 | 命名空间 | 选择标准版实例中的命名空间。命名空间是 OCI 制品仓库的集合,管理多个具有关联属性的 OCI 制品仓库。命名空间的名称通常为企业内部的组织团队名称、产品项目名称或个人自定义名称。 |
镜像名称 | 填写镜像名称,为命名空间创建对应 OCI 制品仓库,用于存储容器镜像,符合开源容器标准的 OCI(Open Container Initiative) 制品。 | |
版本 | 填写镜像版本。为镜像地址的后缀,用于区分基础镜像相同、构建镜像层不同的镜像。 | |
描述 | 填写对镜像的适当描述。 | |
构建配置 | 基于开发机 | 选择需要构建为镜像的开发机。 |