本文旨在提供 ByteHouse 云数仓版计算资源的推荐用量标准,并介绍如何根据这些标准进行监控和调整,以保障业务稳定运行。
ByteHouse 云数仓版的计算资源主要有:计算组、专属 Server、计算组本地盘等。购买这些计算资源进行使用时,需对资源用量保持关注,当资源用量超过风险阈值时,读写成功率会下降。因此,推荐针对资源用量,设置对应的监控告警策略,并对处于风险水位的计算资源及时做规格调整。
以下是各计算资源的用量标准,其中,
资源类型 | 核心用量指标 | 推荐资源水位 | 低风险阈值 | 高风险阈值 |
|---|---|---|---|---|
计算组 | CPU占用率 | 稳定小于 70% | 满足任一条件:
| 满足任一条件:
|
内存占用率 | 稳定小于 70% | 满足任一条件:
| 满足任一条件:
| |
专属 Server | CPU 占用率 | 稳定小于 60% | 满足任一条件:
| 满足任一条件:
|
内存占用率 | 稳定小于 60% | 满足任一条件:
| 满足任一条件:
| |
计算组本地盘 | 磁盘利用率 | 稳定低于 70% | 满足任一条件:
| 满足任一条件:
|
磁盘 IOPS(读)+ 磁盘 IOPS(写) | 读写 IOPS 合计,稳定低于 60% * min{1800+50×容量(GiB), 50000} | 满足任一条件:
| 满足任一条件:
| |
磁盘带宽(读)+ 磁盘带宽(写) | 读/写带宽合计,稳定低于60% * min{120+0.5×容量(GiB),350},单位MB/s | 满足任一条件:
| 满足任一条件:
|
ByteHouse 资源用量数据全部推送至火山引擎云监控产品,您可通过火山引擎云监控控制台进行观测,也可通过 ByteHouse 云数仓版控制台上的租户管理 > 监控告警页面进行观测。
配置告警方式。您可通过 ByteHouse 云数仓版控制台配置,配置详情请参见监控告警。同时您也可以在火山引擎云监控控制台上,参考「ByteHouse 云数仓版本预置告警模板」进行配置,操作详情请参见编辑告警模板。
当用量指标超过阈值时,您可参考下表的调整方式按需调整。
规则 | 调整方式 | |
|---|---|---|
计算组 | CPU 占用率 或 CPU/内存占用率,触发风险阈值 |
计算组扩容操作请参见编辑计算组配置。 |
仅内存占用率,触发风险阈值 |
计算组扩容操作请参见编辑计算组配置。 | |
CPU/内存占用率,按时间周期型存在波谷波峰 | 在 ByteHouse 控制台,通过任务中心 > 新建定时任务,创建计算组伸缩任务,实现定时弹性,操作详情请参见定时任务。 | |
CPU/内存占用率,存在因为业务负载处于波动的情况 | 可使用 ByteHouse 负载弹性功能,详情请参见负载弹性。 | |
专属 Server | CPU 占用率 或 内存占用率,触发风险阈值 | 向上调整规格:如 32 Core 128 GiB * 2 节点 -> 64 Core 256 GiB * 2 节点,如有更高的规格要求,可联系 ByteHouse 团队获取。 |
计算组本地盘 | 磁盘空间利用率,触发风险阈值 | 扩容计算组本地盘,大小按照「扩容后达到推荐资源水位线」预估。 |
磁盘带宽(读 + 写),触发风险阈值 |
| |
磁盘IOPS(读 + 写),触发风险阈值 |
|