You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

超级计算服务器

云服务器提供稳定的弹性计算服务。通过实时增减计算资源,适应业务变动,降低维护成本

社区干货

GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率

要数千台多 GPU 服务器。伴随越来越多企业入局,整个行业的算力产业转型升级也将加剧,一些算力隐患也正在逐渐浮出水面。相较于传统 CPU 硬件,GPU 的一个缺陷是**故障率较高**,这一点在大规模应用场景下尤为明显:由于数量过于庞大,GPU 出现故障的风险也急剧提升;当 GPU 被用于构建超级算力集群协同作业,单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引擎云原生团队基于大量 AIGC 客户...

GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率

运营一个典型的大模型服务一般也都需要数千台多 GPU 服务器。伴随越来越多企业入局,整个行业的算力产业转型升级也将加剧,一些算力隐患也正在逐渐浮出水面。相较于传统 CPU 硬件,GPU 的一个缺陷是 **故障率较高**,这一点在大规模应用场景下尤为明显:由于数量过于庞大,GPU 出现故障的风险也急剧提升;当 GPU 被用于构建超级算力集群协同作业,单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引...

【图说产品】初见云服务器 - 云上弹性计算打造轻便安全的业务环境

服务器(ElasticComputeService,简称ECS)是一种安全稳定、可弹性伸缩的云上虚拟服务器,包含CPU、内存、硬盘、网络等资源,帮助您打造弹性易用、安全可靠的业务环境,有效降低IT维护成本,助力核心业务增长。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/3d3d3bf8a6584b3d82c7789ad440601a~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1715790077&x-signature=A4nT5bB1FWPIB%2B...

【图说产品】初见GPU云服务器 - 专业图像处理、人工智能算法训练及推理的“加速器”

GPU云服务器(GPUCloudComputing,GPU)是提供GPU算力的弹性计算服务,具有高效稳定的计算能力,适用于生成式AI、自动驾驶、图像处理、科学计算等多种应用场景。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/3d0e4040a17b446d821de40d5b061cfd~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1715790077&x-signature=rhcjQ%2BiODToP8zQ8QdHD4GDCU28%3D)

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

超级计算服务器-优选内容

GPU云服务器-火山引擎
GPU云服务器(GPU Compute service)是提供 GPU 算力的弹性计算服务,拥有超强的计算能力,能高效服务于机器学习、科学计算、图形处理、视频编解码等多种场景。火山引擎为您提供随时可取的弹性算力,有效应对计算需求,提升业务效率及竞争力
扩容高性能计算集群
操作场景您可以随时按需扩容高性能计算集群,即在集群中添加新购买的高性能计算GPU云服务器。 操作说明同一集群内,仅支持添加同一可用区、同一私有网络内、同一种规格的云服务器,因此为集群扩容时,会自动继承已有云服务器所属的可用区、私有网络和规格,且不支持变更。 若所属可用区内实例规格已售罄,将不支持扩容。 操作步骤登录高性能计算集群控制台。 单击目标集群对应“操作”列的“扩容”按钮,进入创建实例页面。 参考通过向导...
GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率
要数千台多 GPU 服务器。伴随越来越多企业入局,整个行业的算力产业转型升级也将加剧,一些算力隐患也正在逐渐浮出水面。相较于传统 CPU 硬件,GPU 的一个缺陷是**故障率较高**,这一点在大规模应用场景下尤为明显:由于数量过于庞大,GPU 出现故障的风险也急剧提升;当 GPU 被用于构建超级算力集群协同作业,单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引擎云原生团队基于大量 AIGC 客户...
GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率
运营一个典型的大模型服务一般也都需要数千台多 GPU 服务器。伴随越来越多企业入局,整个行业的算力产业转型升级也将加剧,一些算力隐患也正在逐渐浮出水面。相较于传统 CPU 硬件,GPU 的一个缺陷是 **故障率较高**,这一点在大规模应用场景下尤为明显:由于数量过于庞大,GPU 出现故障的风险也急剧提升;当 GPU 被用于构建超级算力集群协同作业,单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引...

超级计算服务器-相关内容

创建高性能计算集群

操作场景在搭建高性能计算GPU实例前,您需要首先创建高性能计算集群,后续将新购买的高性能GPU云服务器部署在该集群中即可,但不允许将已创建的云服务器加入高性能计算集群。 操作步骤登录高性能计算集群控制台。 单击“创建集群”按钮,配置以下参数。参数 说明 取值示例 地域 不同地域间内网完全隔离。建议选择距离您业务更近的地域,可以降低网络延时,提高访问速度。 华北2(北京) 可用区 可用区是指同一地域中电力、网络隔离的物理...

ECS 选型最佳实践

本节主要介绍使用容器服务(VKE)时如何选择云服务器(ECS)类型以及选择时的注意事项。 集群形态VKE 的控制组件由云平台托管部署,用户无需关心 Kubernetes 集群 Master 节点的选型和运维工作,只需创建 Worker 节点即可... 节点规划通常 Kubernetes 集群可以被视为将一组单机节点抽象成的一个大的超级节点。该超级节点总的计算资源就是所有组成节点的资源的总和。但是由于调度策略、节点管理消耗等原因可能导致选择不同的节点规格运行业...

【图说产品】初见GPU云服务器 - 专业图像处理、人工智能算法训练及推理的“加速器”

GPU云服务器(GPUCloudComputing,GPU)是提供GPU算力的弹性计算服务,具有高效稳定的计算能力,适用于生成式AI、自动驾驶、图像处理、科学计算等多种应用场景。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/3d0e4040a17b446d821de40d5b061cfd~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1715790077&x-signature=rhcjQ%2BiODToP8zQ8QdHD4GDCU28%3D)

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

服务器-火山引擎

服务器 ECS(Elastic Compute Service)是一种安全稳定、可弹性伸缩的云计算服务。您可以随时根据业务需要实时启用和增减计算资源,有效降低IT维护成本,助力核心业务增长

什么是GPU云服务器

GPU云服务器介绍GPU云服务器在普通云服务器上附加了GPU加速卡,在提供超强计算能力的同时,也兼备普通云服务器灵活发放,按需使用的特点,适用于AI训练、AI推理、科学计算、视频渲染等场景。 GPU云服务器提供与普通云服务器一样的使用和管理方式,例如结合私有网络、安全组、密钥对、负载均衡等服务实现丰富的业务架构,灵活便捷的购买并管理GPU云服务器。 除普通GPU云服务器外,火山引擎还为您提供高性能计算GPU集群,在原有GPU型规格的...

【停售公告】停止售卖火山引擎云服务器g1、c1、r1、i1规格族

尊敬的火山引擎用户,火山引擎ECS云服务器服务将于2022年11月07日起停止售卖通用型g1、计算型c1、内存型r1、本地SSD型i1规格族的云服务器产品。后续您可以选择购通用型g3i、计算型c3i、内存型r3i、本地SSD型i2规格族的实例,在新实例上部署您的业务。 停售内容火山引擎ECS云服务器服务将于2022年11月07日起停止售卖通用型g1、计算型c1、内存型r1、本地SSD型i1规格族的云服务器产品。 停售时间2022年11月07日 停售范围所有地域及可用...

GPU服务器使用

本文将介绍如何创建并使用GPU云服务器。 前言GPU云服务器(GPU Compute service)是提供 GPU 算力的弹性计算服务,拥有超强的计算能力,能高效服务于机器学习、科学计算、图形处理、视频编解码等多种场景,本文将介绍如何创建并使用GPU云服务器。 关于实验 预计部署时间:30分钟 级别:初级 相关产品:GPU云服务器 受众: 通用 环境说明 如果还没有火山引擎账号,点击此链接注册账号 如果您还没有VPC,请先点击链接创建VPC。 实验步骤 步骤1...

【停售公告】海外地域停止售卖火山引擎云服务器g2i、c2i、r2i规格族

尊敬的火山引擎用户,亚太东南(柔佛)地域的火山引擎ECS云服务器服务将于2024年7月底停止售卖通用型g2i、计算型c2i、内存型r2i规格族的云服务器产品,在停止售卖前已购买的相关实例可继续正常使用。后续您创建新实例建议选择通用型g3i、计算型c3i、内存型r3i规格族。 停售内容火山引擎ECS云服务器服务计划分两阶段停止售卖通用型g2i、计算型c2i、内存型r2i规格族的云服务器产品,停售时间和影响用户范围如下: 第一阶段停售时间:2024年...

删除高性能计算集群

本文介绍如何删除不再使用的高性能计算集群。 说明 已部署云服务器的高性能计算集群不允许删除。 操作步骤登录高性能计算集群控制台。 单击目标集群对应“操作”列的“删除”按钮。 确认信息,单击“删除”按钮,完成操作。

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询