You need to enable JavaScript to run this app.
导航
监控指标说明
最近更新时间:2024.07.17 11:11:48首次发布时间:2022.05.11 14:00:33

本文介绍表格数据库 HBase 版实例中监控告警支持的指标项及相关说明。

注意事项

  • 云监控默认每 30 秒 获取一次数据,但会根据查看监控数据时选择的查询时间范围,将获取的数据根据不同的周期和方式进行聚合展示,具体规则请参见查看云产品监控数据

  • 当前最多支持查看最近 15 天内的监控数据详情。查看监控数据的方法,请参见查看监控数据

  • 监控指标表中的单位均为基础单位,各监控的具体单位请以控制台为准。控制台上展示的单位会根据监控数值按照一定的换算标准灵活调整,其中:

    • SI:按照 SI 标准,将 1000 作为词头进行单位换算,换算时会在基础单位前增加 K、M、G 等词头。例如,网络输出速率的基础单位为 B/s,若网络输出速率的监控数值较大,控制台上的单位可能会调整为 KB/s、MB/s、GB/s 等。
    • IEC:按照 IEC 标准,将 1024 作为词头进行单位换算。例如,存储(热存)使用情况的基础单位为 B,若存储已使用容量数值较大,控制台上的单位可能会调整为 KiB、MiB、GiB 等。

监控指标说明

您可以调用 GetMetricData 接口查询表格数据库 HBase 版实例的各监控指标数据。调用该接口进行查询时,需要获取以下监控指标的相关信息:

  • Namespace:待查询的监控指标所属的产品空间。
    HBase 实例的产品空间名称为 VCM_HBase

  • SubNamespace:待查询的指标所属的维度。
    HBase 实例支持查看 Cluster(实例)、 RegionServerTable 3 种维度的监控指标。

  • MetricName:待查询的监控指标名称。
    HBase 实例各监控指标对应的 MetricName 如下表所示,更多详情请参见云监控指标查询

实例监控指标

监控指标名称MetricName单位说明
CPU使用率ClusterCpuUtil%实例中所有 Region Server 的平均 CPU 使用率。
内存使用率ClusterMemUtil%实例中所有 Region Server 的平均内存使用率。
网络输出速率ClusterNetworkTransmitThroughputByte/s实例中所有 Region Server 的网络输出速率之和。
网络输入速率ClusterNetworkReceiveThroughputByte/s实例中所有 Region Server 的网络输入速率之和。
QPSClusterQpsCount/s实例中所有 Region Server 的 QPS 之和。
TPSClusterTpsCount/s实例中所有 Region Server 的 TPS 之和。
存储(热存)使用情况ClusterSpaceQuotaUsageB实例存储空间(热存)的实时使用量。
存储(热存)水位ClusterSpaceUsagePercent%实例已使用热存空间与总热存空间的实时百分比。
Thrift请求平均响应时间ThriftCallMeanTimeμs实例服务端接收到 Thrift 请求到响应的平均时间。
Thrift请求最大响应时间ThriftCallMaxTimeμs实例服务端接收到 Thrift 请求到响应的最大时间。
存储(冷存)使用量ClusterColdSpaceQuotaUsageB实例容量型存储空间(冷存)的实时使用量。
存储(冷存)水位ClusterColdSpaceQuotaUsagePercent%实例已使用容量型存储(冷存)空间与总容量型存储空间的实时百分比。

Region Server 监控指标

监控指标名称MetricName单位说明
CPU使用率CpuUtil%Region Server 的 CPU 使用率。
内存使用率MemUtil%Region Server 的内存使用率。
网络输出速率NetworkTransmitThroughputByte/sRegion Server 的网络输出速率。
网络输入速率NetworkReceiveThroughputByte/sRegion Server 的网络输入速率。
QPSQpsCount/sRegion Server 的 QPS。
TPSTpsCount/sRegion Server 的 TPS。
RPC请求队列长度RpcRequestQueueLengthCountRegion Server 中 RPC 请求队列中等待处理的请求数量。
Compaction队列长度CompactionQueueLengthCountRegion Server 中等待执行的 Compaction 任务的数量。
Flush队列长度FlushQueueLengthCountRegion Server 中等待执行的 Flush 任务的数量。
Region数量RegionCountCountRegion Server 持有的 Region 数量。
Get请求平均耗时AvgGetRtμsRegion Server 处理 Get 请求的平均耗时,不包括等待时间。
BlockCache 命中率BlockCacheHitRate%Region Server 的读请求命中 BlockCache 的比率。
Put请求平均耗时AvgPutRtμsRegion Server 处理 Put 请求的平均耗时,不包括等待时间。
Scan请求平均耗时AvgScanRTμsRegion Server 处理 Scan 请求的平均耗时,不包括等待时间。
BatchPut请求平均耗时AvgBatchPutRtμsRegion Server 处理 BatchPut 请求的平均耗时,不包括等待时间。
RPC请求平均响应时间AvgRpcCallRtμsRegion Server 中 RPC 请求平均响应时间,包括请求等待时间、处理时间等。
RPC请求最大响应时间MaxRpcCallRTμsRegion Server 中 RPC 请求最大响应时间,包括请求等待时间、处理时间等。

Table 监控指标

监控指标名称MetricName单位说明
QPSTablesReadRequestCountCount/s统计表的 QPS。
TPSTableWriteRequestCountCount/s统计表的 TPS。
读请求平均响应时间rpcReadCallTotalTimeMeanμs统计表的所有读请求的平均响应时间。
读请求最大响应时间rpcReadCallTotalTimeMaxμs统计表的所有读请求的最大响应时间。
写请求平均响应时间rpcWriteCallTotalTimeMeanμs统计表的所有写请求的平均响应时间。
写请求最大响应时间rpcWriteCallTotalTimeMaxμs统计表的所有写请求的最大响应时间。
热存空间使用量HotStorageSpaceUsageB统计表的存储空间(热存)实时使用量。