You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

产品优势

高效通信

极致可扩展算力

高性能计算集群内的实例间最高支持3.2 Tbps RDMA网络高速互联,微秒级别超低时延,为大规模训练提供高线性加速比。
智能运维

持续稳定运行

一键自动检测工具达到分钟级故障定位,毫秒级监控帮助精准分析异常。故障后自动发送事件通知,多种处理方式降低业务影响。
亲和调度

通信最优选路

训练任务亲和调度到同交换机下通信,配合多导轨物理网络架构,让数据少绕路训练更高效。
算力底座

无缝对接火山方舟

提供稳定高效的算力底座,与机器学习平台、火山方舟一起打造从基础设施到模型生态的完整解决方案,助力AI赋能千行百业。

产品功能

HPC集群

HPC集群

高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储

高速存储

提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用

开箱即用

GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享

容器共享

在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。
HPC集群

HPC集群

高性能计算集群内所有计算节点通过RDMA高速网络互联,且支持通过RDMA 直接访问vePFS 文件存储。
高速存储

高速存储

提供高吞吐、低延时、可扩展并行的文件存储,与计算集群间高达400GB/s通信网络,10分钟级完成训练数据拉取。
开箱即用

开箱即用

GPU云服务器支持丰富的系统环境和软件支持,涵盖各类主流镜像,封装多版本CUDA和驱动,提供开箱即用的AI基础架构能力。
容器共享

容器共享

在保证性能和故障隔离的基础上, 支持启动多个容器共享一张 GPU ,实现GPU算力与显存的灵活切分与隔离,提升 GPU 使用率。

应用场景

大语言模型训练

AI内容生成推理

自动驾驶

科学计算

架构图
大语言模型训练
提供稳定高性价比的算力, 3.2Tbps RDMA高速网络,高性能文件存储,轻松应对大规模分布式训练场景。

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络

相关产品

架构图

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
架构图
AI内容生成推理
采用ECS+VKE+TOS等多项产品服务组合方案,为客户提供灵活、弹性、高性价比的推理服务GPU集群,迅速满足业务需求。

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力

相关产品

架构图

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
自动驾驶
自动驾驶
在智能驾驶的源数据上云、数据预处理/预标注、自驾训练等环节中,提供弹性灵活的ECS和GPU算力、高性能存储vePFS和RDMA网络,协助用户完成自驾业务的快速升级和迭代。

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化

相关产品

自动驾驶

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
科学计算
科学计算
在科研和工程仿真领域,火山云可以在生命科学、宇宙天文、量子物理、计算化学和天体物理材料设计、气候气象,海洋探测等学科中匹配上层应用的高性能计算集群。

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

相关产品

科学计算

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

大语言模型训练

架构图

架构优势

高性价比GPU服务,节省成本
满足高吞吐低延时数据读写需求
3.2T RDMA高速网络
架构图

架构优势

提供稳定高性价比算力
实现资源快速弹性伸缩
提供全链路产品能力
自动驾驶

架构优势

全栈产品能力,业务云上闭环
稳定的算力,超强网络性能
计算和通信多维度软件优化
科学计算

架构优势

高速RDMA互联网络
高性能弹性集群算力
软硬件适配加速科研创新

产品动态

支持后台安装 GPU 驱动/CUDA/CUDNN
GPU 服务器正常工作需安装 GPU 驱动等基础软件,针对 GPU 机型支持丰富的 OS 和更高驱动版本的组合,协助您更加灵活、高效的完成基础环境的部署。
2025.10.24
集群诊断新增支持网络性能测试
新增支持集群内实例之间的 nccl-tests 建连和 nccl-tests 性能测试
2025.08.27
GPU 性能计算器上线
构建 AI 模型在不同 GPU 卡型和不同机型上的快速性能评估能力,用数据助力实例规格的判断选型。
2025.06.05
高性能计算集群支持集群诊断
集群诊断是一种面向高性能计算集群的问题诊断工具,提供对高性能计算 GPU 型实例的系统状态、硬件健康状态、应用程序、性能、网络等状态等进行全面诊断。
2024.10.24
单个 HPC 集群支持挂载 5 个 vePFS
HPC GPU 高性能计算集群与 vePFS 智算版并行文件系统互通 RDMA,绑定数量从 1:1 增加到 1:5。
2023.09.05
支持查询实例的 RDMA 网络交换机信息
可以通过 openAPI 查询高性能计算 GPU 型实例所在物理位置的 RDMA 网络交换机信息,以此进行训练任务调度和排序。
2023.07.10
实例监控新增 RDMA 相关指标
高性能计算 GPU 型实例监控新增 RDMA 相关指标,您可通过云监控服务实时监控 RDMA CNP、ECN 和 QP 等相关指标数据。
2023.06.21
GPU 实例硬件相关 FAQ 发布
围绕 GPU 实例的常见故障,梳理处理建议和 FAQ,提升用户体验。
2023.06.20
Windows 2022 镜像支持内置 GRID
GPU 渲染型实例新增支持 Windows 2022 数据中心版with GRID 镜像,内置 GPU 驱动和 VWS 授权。
2023.06.19
GPU 支持 ENI trunking 特性
通过对接 ENI trunking,单个 GPU 规格切分之后,可以支持更高密度的容器。
2023.06.12
A800 实例 ebmhpcpni2l 邀测上线
火山引擎邀测发布基于 NVIDIA A800 Tensor Core GPU 的高性能计算 GPU 型实例 ebmhpcpni2l。
2023.04.27
A10 实例 gni2、gni2-vws 邀测上线
GPU 云服务器正式发布基于 NVIDIA A10 Tensor Core GPU 的云服务器 gni2、gni2-vws 实例。
2023.04.27
支持后台安装 GPU 驱动/CUDA/CUDNN
GPU 服务器正常工作需安装 GPU 驱动等基础软件,针对 GPU 机型支持丰富的 OS 和更高驱动版本的组合,协助您更加灵活、高效的完成基础环境的部署。
2025.10.24
集群诊断新增支持网络性能测试
新增支持集群内实例之间的 nccl-tests 建连和 nccl-tests 性能测试
2025.08.27
GPU 性能计算器上线
构建 AI 模型在不同 GPU 卡型和不同机型上的快速性能评估能力,用数据助力实例规格的判断选型。
2025.06.05
高性能计算集群支持集群诊断
集群诊断是一种面向高性能计算集群的问题诊断工具,提供对高性能计算 GPU 型实例的系统状态、硬件健康状态、应用程序、性能、网络等状态等进行全面诊断。
2024.10.24
单个 HPC 集群支持挂载 5 个 vePFS
HPC GPU 高性能计算集群与 vePFS 智算版并行文件系统互通 RDMA,绑定数量从 1:1 增加到 1:5。
2023.09.05
支持查询实例的 RDMA 网络交换机信息
可以通过 openAPI 查询高性能计算 GPU 型实例所在物理位置的 RDMA 网络交换机信息,以此进行训练任务调度和排序。
2023.07.10
实例监控新增 RDMA 相关指标
高性能计算 GPU 型实例监控新增 RDMA 相关指标,您可通过云监控服务实时监控 RDMA CNP、ECN 和 QP 等相关指标数据。
2023.06.21
GPU 实例硬件相关 FAQ 发布
围绕 GPU 实例的常见故障,梳理处理建议和 FAQ,提升用户体验。
2023.06.20
Windows 2022 镜像支持内置 GRID
GPU 渲染型实例新增支持 Windows 2022 数据中心版with GRID 镜像,内置 GPU 驱动和 VWS 授权。
2023.06.19
GPU 支持 ENI trunking 特性
通过对接 ENI trunking,单个 GPU 规格切分之后,可以支持更高密度的容器。
2023.06.12
A800 实例 ebmhpcpni2l 邀测上线
火山引擎邀测发布基于 NVIDIA A800 Tensor Core GPU 的高性能计算 GPU 型实例 ebmhpcpni2l。
2023.04.27
A10 实例 gni2、gni2-vws 邀测上线
GPU 云服务器正式发布基于 NVIDIA A10 Tensor Core GPU 的云服务器 gni2、gni2-vws 实例。
2023.04.27