You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

服务器故障处理流程

云服务器提供稳定的弹性计算服务。通过实时增减计算资源,适应业务变动,降低维护成本

社区干货

排查The MySQL server is running with the --read-only option问题

# **问题现象**应用程序在连接 RDS MySQL 时偶发出现如下报错:```Plain TextThe MySQL server is running with the --read-only option so it cannot execute this statement```# **排查步骤**## 查看实例是... 主实例发生故障导致主从切换。3. 用户手动对实例进行重启,重启操作会触发主备切换动作。用户可以在 RDS MySQL 控制台,事件中心找到此类事件的详细信息。## 磁盘空间利用率100%当磁盘写满之后,实例将进入只读状...

Kubernetes 安全权限管理深度剖析|社区征文

关于认证和鉴权模块在服务器端的处理流程可以参考下图:![image.png](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/bc3e635aff234b1baeaa8e4cd1a7adf5~tplv-k3u1fbpfcp-5.jpeg?)如上图所示,当Token、X509、WebHook等流程出现问题时,会直接返回客户端状态码401。当认证模块没有问题,请求会进入鉴权模块,如果ABAC、RBAC、WebHook等流程出现异常,会直接返回客户端状态码403。Kubernetes 支持多种鉴权模块,例如ABAC模式...

修改/usr/lib64文件名称,导致命令无法使用并且无法正常登录到云服务器

服务器过程中,误将关键文件`/usr/lib64`更名,导致无法使用命令并且ECS实例系统也处于不可用的状态。由于命令不可用,因此也无法通过`mv`命令重新更名文件。## 问题分析`/usr/lib64`文件是Linux系统中存放系统命令的文件目录,将该文件目录更名后,将会导致出现命令不可用并且系统故障的情况。因此,当发生这种情况时,我们无法通过命令`mv`去重命名被修改的`/usr/lib64`文件名。具体修复方法可以参考以下方法。## 问题解决### 方...

干货 | 在字节跳动,一个更好的企业级SparkSQL Server这么做

SparkSQL存在易用性较差的问题,导致难满足日常的业务开发需求。**本文将详细解读,如何通过构建SparkSQL服务器实现使用效率提升和使用门槛降低。**# 前言Spark 组件由于其较好的容错与故障恢复机制,在企业的长时... SparkSQL可直接输入SQL对数据进行ETL等工作的处理,极大提升了易用度。但是相比Hive等引擎来说,由于SparkSQL缺乏一个类似Hive Server2的SQL服务器,导致SparkSQL在易用性上比不上Hive。很多时候,SparkSQL只能将自身...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

服务器故障处理流程-优选内容

查询与响应“系统故障,导致实例重新部署”事件
查询与响应SystemFailure.Redeploy(系统故障,导致实例重新部署)事件,快速排除故障、确保云产品稳定运行。 操作场景当云服务器宿主机(物理机)出现故障导致宕机时,可能需要将实例重新部署至新的宿主机,恢复实例正常运行。火山引擎不仅会通过事件通知告知您,同时还为您提供了完善的自动化运维方式,协助您快速排除故障。 场景一:保持实例停止状态本场景适用于触发事件时,您不期望实例重新部署至其他宿主机。 操作流程当云服务器实例触...
GPU实例硬件相关FAQ
如何判断和处理硬件相关故障?GPU实例相比普通云服务器实例,增加了较多的外设,包括GPU、RDMA网络直通网卡、本地盘等。因此,除普通云服务器可能发生的常见问题外,还有如GPU、直通网卡以及PCIe链路上发生的亚健康或故障。针对GPU实例的常见故障和处理建议具体如图1所示。 图1 常见故障及处理建议 图2 故障处理流程GPU亚健康或故障处理流程如图2所示,以下重点介绍亚健康现象的处理流程。 除亚健康外的其它故障现象,您可以通过工单系统...
故障处理
安装监控插件失败问题描述若实例所在私有网络的DNS服务器地址非平台提供的默认地址,则无法成功安装监控插件,失败回显如下: Could not resolve host: tos-s3-cn-beijing.ivolces.com; Unknown error解决方法请登录实... 无法收到告警邮件确认所选联系人的联系方式有效。 如果仍无法收到通知,请检查发送告警通知的邮箱是否加入白名单。火山引擎会使用monitor@monitor.volces.com邮箱为您发送告警邮件,请确认已将该邮箱加入联系人邮...
GPU 实例硬件相关问题
如何判断和处理硬件相关故障?GPU实例相比普通云服务器实例,增加了较多的外设,包括GPU、RDMA网络直通网卡、本地盘等。因此,除普通云服务器可能发生的常见问题外,还有如GPU、直通网卡以及PCIe链路上发生的亚健康或故障。针对GPU实例的常见故障和处理建议具体如图1所示。 图1 常见故障及处理建议 图2 故障处理流程GPU亚健康或故障处理流程如图2所示,以下重点介绍亚健康现象的处理流程。 除亚健康外的其它故障现象,您可以通过工单系...

服务器故障处理流程-相关内容

故障处理

CLB监控没有请求状态码数据 如何将CLB HTTP流量重定向至HTTPS 如何排查访问CLB 7层监听器报错504/502的问题 如何排查请求 CLB 服务报错 ERR_TOO_MANY_REDIREC问题 如何排查上传mkcert生成证书公私钥不匹配的问题 如何排查后端服务器安全组未开放导致无法访问CLB的问题 解决负载均衡返回413请求实体过大的问题 如何排查负载均衡CLB报错503错误码的问题 如何排查负载均衡CLB报错404错误码的问题 排查压测CLB时并发连接数增加后性能...

入门指引

可通过负载均衡将访问请求分发到多台后端服务器进行处理。通过配置健康检查,负载均衡能够自动识别异常后端服务器,并将访问请求分发到正常后端服务器处理,避免单点故障,提高业务的可用性。 准备工作在配置CLB实例前... 确定云服务器实例关联的安全组已开放了提供服务的端口(TCP 80端口)并放通了负载均衡健康检查网段:参考配置后端服务器安全组。 配置流程四层负载均衡服务的配置流程如下所示。 创建负载均衡实例:根据实际业务场景和...

用户可选“系统故障,导致实例重新部署”事件的默认响应方式

ECS实例所在物理服务器宕机时,默认行为是将实例重新部署到其他服务器上,并生成“系统故障,导致实例重新部署”事件用户。但是部分用户的应用已经提供了节点切换等灾备机制。物理服务器发生宕机时,如果再强制将ECS实例在其他服务器上拉起,会破坏原有的选举机制,导致多个主节点的“脑裂”现象。 为了避免这种现象,用户对应用层有灾备机制的实例,设置默认响应方式为“禁止疏散实例”。物理服务器发生宕机后,实例不做疏散,完全依赖应用...

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

服务器实例或网卡被删除后,支持自动从负载均衡的后端服务器组中移出

负载均衡是一种将访问流量按策略分发给多台后端服务器的服务,可以扩展系统对外服务能力,消除单点故障,从而提高系统的整体可用性。 后端服务器组是接收并处理请求的实例组,CLB实例会根据监听器的配置将客户端请求分发到后端服务器上,CLB实例内的后端服务器组内支持添加云服务器实例或云服务器实例上的网卡。 此次发布后,当用户手动删除云服务器实例或实例上的辅助网卡后,将不再需要于负载均衡产品控制台内或调用OpenAPI将对应后端...

故障处理

由于nouveau模块导致Nvidia GPU operator无法正常运行 使用A100显卡的训练进程异常中断,如何排查问题? 如何判断和处理GPU实例硬件相关故障? 如何重置GPU?

排查The MySQL server is running with the --read-only option问题

# **问题现象**应用程序在连接 RDS MySQL 时偶发出现如下报错:```Plain TextThe MySQL server is running with the --read-only option so it cannot execute this statement```# **排查步骤**## 查看实例是... 主实例发生故障导致主从切换。3. 用户手动对实例进行重启,重启操作会触发主备切换动作。用户可以在 RDS MySQL 控制台,事件中心找到此类事件的详细信息。## 磁盘空间利用率100%当磁盘写满之后,实例将进入只读状...

新功能发布记录

本文介绍了云服务器ECS各特性版本的功能发布动态,新特性将在各个地域(Region)陆续发布,欢迎体验。 说明 “邀测”产品或功能暂未对全部用户开放。为方便了解产品,部分“邀测”产品或功能的配套文档已开放给全部用户... 出现IO hang问题故障处理 4 计费模式为“包年包月”的实例,更换操作系统时,支持使用代金券抵扣费用。 更换操作系统 5 监控 本地盘故障时,支持进行更换故障盘、重新部署实例操作。 本地盘事件运维流程 6 正式上线...

镜像FAQ

如何更换云服务器实例的镜像? CentOS 8.3更换为CentOS 6.9后,为什么无法挂载数据盘? Windows Server镜像不同版本的内存限制? Windows镜像创建大数据型ECS实例后,无法识别本地数据盘如何处理? Windows镜像为什么无... 如何解决? 公共镜像问题 CentOS 8 EOL(停止支持)之后相关的公共镜像会下架吗? CentOS 8 EOL(停止支持)之后对我的ECS实例有什么影响? 火山引擎是否支持Windows Server 2008和Windows Server 2008 R2操作系统? 公共...

迁移流程故障

迁移工具Agent报错“checkVirtioInstall fail”或“Check initramfs failed”如何解决? 使用文件复制方式迁移UEFI启动模式服务器到三代云服务器实例,实例无法启动如何解决? 迁移工具Agent提示“系统事件与标准时间差异较大”如何处理? 使用文件复制方式迁移时,出现异常如何处理?

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

数据智能知识图谱
火山引擎数智化平台基于字节跳动数据平台,历时9年,基于多元、丰富场景下的数智实战经验打造而成
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询