You need to enable JavaScript to run this app.
导航

批量计算套件概述

最近更新时间2024.04.16 15:12:50

首次发布时间2023.09.25 16:09:31

云原生批量计算套件是部署在火山引擎容器服务(VKE)上用于处理大规模批量计算任务的套件服务。

说明

该功能目前处于 公测 阶段。

套件介绍

批量计算套件能够充分利用 VKE 集群的计算(包括云服务器类型节点、虚拟节点)、存储以及网络资源,为用户提供异构资源混合调度能力,多队列管理能力、队列资源共享调度能力等。批量计算套件可支持海量作业、并发规模的作业有序调度运行,广泛应用于 AI 训练与推理、基因数据分析、多媒体渲染、金融风险分析、自动驾驶、日志处理、高性能计算(HPC)等场景。

套件架构

批量计算套件架构如下图所示。
alt

使用流程

不同的角色,使用批量计算套件的流程如下图所示。
alt

角色主要使用流程

批量计算管理员

  1. 负责开通 Batch 服务,配置托管 Prometheus 服务(VMP)、日志服务等的相应资源。
  2. 部署和运维 Batch 核心组件。
  3. 创建、配置与管理队列(队列组),管理队列资源配额以及相应抢占、排队策略。
  4. 监控队列以及任务的运行状态、指标、日志等。

批量计算用户

  1. 提交批量计算作业至相应的队列。
  2. 获取任务的运行结果。

更多批量计算套件的使用方法,请参见: