You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

运维问题自动化

社区干货

克服 ClickHouse 运维难题:ByteHouse 水平扩容功能上线

# 前言对于分析型数据库产品,通过增加服务节点实现集群水平扩容,并提升集群性能和容量,是运维的必要手段。但是对于熟悉 ClickHouse 的工程师而言,听到“扩容”二字一定会头疼不已。开源 ClickHouse 的 MPP 架... 解决自动化流程的问题,也为用户提供了性能开销更低的扩容方式。具体我们通过数据库引擎优化和操作界面优化两方面来实现。## 数据库引擎优化ByteHouse 的数据库引擎自研 `Alter Table...Resharding`命令,将一...

数据库顶会 VLDB 2023 论文解读:字节跳动如何解决超大规模流式任务运维难题

机型差异等问题。这样的变化会带来各种运行时问题,例如数据积压和各种故障,导致需要频繁的人工介入或者预留过量的资源造成浪费。随着流计算的规模快速增长,亟需一套运行时管控系统来自动化地的解决这些运行时问题。... 并提供了可视化平台供用户和运维人员分析使用。其内部主要涵盖了如下四种等类型的诊断规则:资源使用情况分析与建议、运行异常收集分析与建议、Flink 配置分析与建议、处理瓶颈情况分析与建议。用户可以进行自主检测...

数据库顶会 VLDB 2023 论文解读:字节跳动如何解决超大规模流式任务运维难题

机型差异等问题。这样的变化会带来各种运行时问题,例如数据积压和各种故障,导致需要频繁的人工介入或者预留过量的资源造成浪费。随着流计算的规模快速增长,亟需一套运行时管控系统来自动化地的解决这些运行时问题。... 并提供了可视化平台供用户和运维人员分析使用。其内部主要涵盖了如下四种等类型的诊断规则:资源使用情况分析与建议、运行异常收集分析与建议、Flink 配置分析与建议、处理瓶颈情况分析与建议。用户可以进行自主检测...

如何构建企业内的 TiDB 自运维体系

就是为了简化接入成本与运维成本,访问流量的负载均衡以及节点扩缩容可以通过调整 SLB 解决。当然如果能够实现 SDK 负载均衡与故障剔除,结合配置中心的流量调度也是非常好的解决方案。得物 TiDB 部署均采用单机单实... 比如一个表的多个 DDL 操作无法合并的问题,可以通过自动化手段降低复杂度;BIGINT 更改为 INT 这种长改短的就是日常变更规范中要管控的。* **产品流行度**- - MySQL如果我们从 MySQL 1.0 开始算起至今已经有...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

运维问题自动化-优选内容

运维助手】运维助手邀测上线
导致传统的自动化运维的方式在云上使用门槛很高。 一方面,云厂商提供的很多云服务都需要部署在云服务器实例中,例如RDS,容器服务和消息队列等。由于云服务众多,迭代频繁,所以必须要通过CI/CD的方式进行快速发布和变更。如果每个服务都有自己的安装/部署的通道,会导致云服务器实例中运行各种Agent,既难以管理,也容易增加潜在故障点。 另一方面,用户想要对云服务器进行自动化运维时,又面临着效率低、学习成本高的问题。以使用Ansibl...
定时任务和运维任务
ByteHouse 企业版支持定时任务功能,通过任务自动化,执行定时查询、数据导入等操作,从而实现自动化能力,降低运维成本,提升工作效率。 定时任务概述ByteHouse 支持在界面新建与管理定时任务,任务包括以下几种: SQL 查询任务:支持定时执行该 SQL 查询 数据导入任务:导入执行任务的定时启动 运维任务:集群升级,集群重启等(当前仅支持展示) SQL 查询任务 新建定时任务访问 运维与权限管理 -> 任务中心 -> 定时任务,并点击 新建定时任...
运维概述
为提高云服务器实例运行稳定性,火山引擎为您提供了运维服务,可以帮助您快速处理实例异常,确保业务平稳运行。 获取实例系统日志与屏幕截图您可以通过本功能查看云服务器实例系统日志与屏幕截图,帮助您在实例出现故障、无法正常远程登录等情况下,排查定位故障原因。详情可查看获取实例系统日志与屏幕截图。 批量作业批量作业是火山引擎打造的原生自动化运维工具。您可以通过批量作业以免密码、免登录、无需使用跳板机的形式,在单个...
克服 ClickHouse 运维难题:ByteHouse 水平扩容功能上线
# 前言对于分析型数据库产品,通过增加服务节点实现集群水平扩容,并提升集群性能和容量,是运维的必要手段。但是对于熟悉 ClickHouse 的工程师而言,听到“扩容”二字一定会头疼不已。开源 ClickHouse 的 MPP 架... 解决自动化流程的问题,也为用户提供了性能开销更低的扩容方式。具体我们通过数据库引擎优化和操作界面优化两方面来实现。## 数据库引擎优化ByteHouse 的数据库引擎自研 `Alter Table...Resharding`命令,将一...

运维问题自动化-相关内容

数据库顶会 VLDB 2023 论文解读:字节跳动如何解决超大规模流式任务运维难题

机型差异等问题。这样的变化会带来各种运行时问题,例如数据积压和各种故障,导致需要频繁的人工介入或者预留过量的资源造成浪费。随着流计算的规模快速增长,亟需一套运行时管控系统来自动化地的解决这些运行时问题。... 并提供了可视化平台供用户和运维人员分析使用。其内部主要涵盖了如下四种等类型的诊断规则:资源使用情况分析与建议、运行异常收集分析与建议、Flink 配置分析与建议、处理瓶颈情况分析与建议。用户可以进行自主检测...

运维监控常见问题

本文罗列了与运维监控有关的常见问题问题导航如何自定义告警策略? 指标数据对应的时间粒度是多少? 根因诊断如何进行? 问题列表 如何自定义告警策略?您可以前往多云CDN控制台的 告警应急 > 策略管理 页面,创建告... 根因诊断的结果包含以下信息: 出故障的对象:问题发生在 CDN 节点,还是源站? 出故障的位置:如果是 CDN 节点发生问题,具体是哪个或哪些 CDN 服务商的节点有问题;如果是源站发生问题,具体是哪个或哪些源站地址异常? ...

运维助手】批量作业正式发布

批量作业是火山引擎ECS打造的原生自动化运维工具,免密码、免登录即可在多台云服务器实例上执行(Shell、Python)命令。相比用户登录实例手动输入命令,或通过第三方开源运维工具(如Ansible),批量作业的使用门槛更低(不需要部署和调试),运维效率更高。 批量作业支持如下功能特性: (安装Agent的实例)可以免登录对云服务器执行命令,并查看执行结果。最高支持200个云服务器实例并发执行。 任务中可以使用系统内置的公共命令,或用户自定...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品优势

简化开发运维的流程。 连接万物连接云上中间件和数据库等产品,帮助用户打通上下游,快速构建复杂的服务系统。 省心运维提供在线测试能力、丰富的多维度监控和日志功能,满足用户可视化观测函数行为的需求,解决 debug 难题。 弹性免运维完全托管的计算服务函数全托管,无需购买和管理服务器等基础设施,将运维难题交给平台。 自动化的弹性伸缩仅需提前设置扩容上限,函数服务将根据业务请求量自动弹性扩缩容,灵活应对业务的波峰波谷。 ...

私有化部署系统运维

1. 概述 运维工作,是保障平台稳定运行的重要工作,本文将指导运维工程师进行快速的问题分析、问题解决,进行日常应用运维工作。本文主要从两个部分进行介绍:应用服务运维与基础组件运维,主要适用于智能数据洞察的私有化部署情况。 2. 应用服务运维说明 运维工程师可以通过 Kubernetes dashboard 对服务进行操作,也可以通过 kubectl 命令进行日常运维操作。 2.1 Kubernetes Dashboard用户可以通过如下 URL 访问 Kubernetes 页面:htt...

如何构建企业内的 TiDB 自运维体系

就是为了简化接入成本与运维成本,访问流量的负载均衡以及节点扩缩容可以通过调整 SLB 解决。当然如果能够实现 SDK 负载均衡与故障剔除,结合配置中心的流量调度也是非常好的解决方案。得物 TiDB 部署均采用单机单实... 比如一个表的多个 DDL 操作无法合并的问题,可以通过自动化手段降低复杂度;BIGINT 更改为 INT 这种长改短的就是日常变更规范中要管控的。* **产品流行度**- - MySQL如果我们从 MySQL 1.0 开始算起至今已经有...

GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率

单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引擎云原生团队基于大量 AIGC 客户服务经验,结合针对大模型训练和在线推理业务的产品解决方案,推出 GPU 故障检测及自愈能力,帮助... 本次新推出的 GPU 故障检测及自愈能力,是云原生 AI 套件在 **AI-Infra 运维**能力上的进一步增强。它不仅能够帮助企业用户及时发现并告警 GPU 故障,还能够根据具体业务运行情况,执行用户授权的自愈恢复操作,从而...

2022技术盘点之平台云原生架构演进之道|社区征文

多云管理平台解决异构的基础设施资源复杂难管理问题。平台可纳管不同环境、不同云厂商资源统一管理,并结合平台的统一监控告警、统一服务管理、统一运营管理、统一运维管理、自动化运维等能力能极大简化云用户、云运维、云运营各角色的工作复杂度,提升管理效率和资源交付效率,最终帮助企业降低云上成本,提升人员效率,加速企业的数字化转型。## 二 高可用架构云的时代需要新的技术架构,来帮助企业应用能够更好地利用云计算优势...

GPU 故障检测及自愈:大幅提升 AI 场景的硬件故障运维效率

单点故障会迅速扩散,造成大规模的连锁反应,继而影响业务稳定。针对上述问题,火山引擎云原生团队基于大量 AIGC 客户服务经验,结合针对大模型训练和在线推理业务的产品解决方案,推出 **GPU 故障检测及自愈能力... 本次新推出的 GPU 故障检测及自愈能力,是云原生 AI 套件在 **AI-Infra 运维**能力上的进一步增强。它不仅能够帮助企业用户及时发现并告警 GPU 故障,还能够根据具体业务运行情况,执行用户授权的自愈恢复操作,从而...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询