You need to enable JavaScript to run this app.
导航

查看监控数据

最近更新时间2024.04.19 11:50:04

首次发布时间2022.04.22 23:36:52

消息队列 RocketMQ版已接入云监控,实例日常运行过程中,您可以在消息队列 RocketMQ版控制台或云监控控制台直接查看各项监控指标,实时分析实例的运行状态。本文档为您展示消息队列 RocketMQ版监控数据的查看方式与主要监控指标。

前提条件

查看监控数据前,请提前创建消息队列 RocketMQ版实例。

通过 RocketMQ 控制台查看监控数据

  1. 登录消息队列 RocketMQ版控制台
  2. 在顶部菜单栏中选择实例所在的地域。
  3. 实例列表页面中找到指定实例,并单击实例名称。
  4. 云监控页签中查看监控数据。
    云监控页签中默认展示截止当前时刻 1 天内的监控数据,您也可以指定时间段查看数据。您还可以:
    • 开启图表联动,查看某一时刻所有监控项的数据值。
    • 单击查看更多指标,跳转到云监控控制台查看当前账号下所有产品的监控数据。
    • 单击创建告警策略,跳转到云监控控制台创建常见场景的告警策略。
      页面展示的监控指标包括实例消息生产流量速率、实例消息消费流量速率、实例磁盘使用率等。详细说明请参考监控指标说明

    说明

    请确认生产者和消费者已成功接入,否则消费者数、消息数等数据均显示为0。

通过云监控控制台查看监控数据

您也可以通过云监控控制台查看监控数据,监控项与 RocketMQ 控制台中完全一致。

  1. 登录云监控控制台
  2. 在左侧导航栏中单击云产品监控,并在中间件区域中选择消息队列 RocketMQ版
    页面中展示当前的告警概况、资源数量分布和实例列表,实例列表中展示各个实例的状态、主题数量、消费组数量、消息生产流量速率和消息消费流量速率。
  3. 单击实例名称,进入该实例的监控数据页面。

监控指标说明

说明

  • 数据备份数据同步页签下的数据分别为数据备份功能与数据同步功能相关监控数据。这些功能目前为邀测状态,未开通该功能时,对应指标显示为空。若您有相关的业务需求,可以通过工单系统联系技术支持申请白名单权限。
  • 监控指标表中的单位均为基础单位,各监控的具体单位请以控制台为准。控制台上展示的单位会根据监控数值按照一定的换算标准灵活调整,例如,消息生产速率的基础单位为 Count/s,若消息生产速率的监控数值已达到了每秒数千、数百万条或数十亿,控制台上的单位可能会调整为 KCount/s、MCount/s 或 BCount/s。

实例

消息队列 RocketMQ版在实例维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

MsgProductionRate

消息生产速率

Count/s

实例每秒收到的消息数。

MsgConsumptionRate

消息消费速率

Count/s

实例每秒被消费的消息数。

MsgProductionConsumptionrRate

消息生产消费总速率

Count/s

实例每秒收到和被消费的消息总数。

InstanceTPSUsedRatio

实例TPS使用率

%

实例的TPS使用率,统计方式为:(生产TPS+消费TPS)/ 实例规格对应的TPS上限。

InstanceTopicNum

Topic个数

Count

实例的 Topic 数量。

InstanceGroupNum

消费组个数

Count

实例的消费组数量。

InstanceConnectionNum

消费组客户端总数

Count

实例的消费客户端总数。

ProduceConnectionCount

生产连接数

Count

实例所有节点中,生产者连接数的最大值。

InstanceConnectionRate

连接数使用率

%

实例的最大连接数使用率。统计方式为该实例所有节点当前的客户端连接总数/当前计算规格的连接数上限。

MsgProductionSizeRate

生产流量速率

Bytes/s

实例每秒生产的数据流量。

MsgConsumeSizeRate

消费流量速率

Bytes/s

实例每秒消费的数据流量。

CpuUtil

CPU使用率

%

统计实例各节点中 CPU 占用率的最大值。

MemUtil

内存使用率

%

统计实例各节点中内存使用率的最大值。

CapUtil

磁盘使用率

%

实例各节点中磁盘使用率的最大值。

InstanceSendFailedMsgNum

写入失败消息数

Count

统计周期内实例写入失败的消息总数。

InstanceSendFailedMsgRate

写入消息失败速率

Count/s

实例每秒钟写入失败的消息数量。

MsgPutTime

消息生产平均耗时

ms

统计实例生产请求的平均耗时。

MsgPutLatencyP99

消息生产P99耗时

ms

统计实例生产请求的 P99 耗时。

InstanceBigMsgCount

大消息数量

Count

实例每分钟收到的消息 size 大于 1M 的消息数量。

TopicPutTpsTop10

Topic生产速率Top10

Count/s

Topic生产消息速率Top 10。

说明

CPU使用率、内存使用率仅适用于2023年7月19日之后创建的实例,在此之前创建的实例若需查看该指标,可通过工单系统联系技术支持申请升级实例版本。

实例均衡状态

消息队列 RocketMQ版在实例均衡状态维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

MaxDiskCapUtil

节点最大磁盘使用率

%

实例所有节点磁盘使用率的最大值。

MinDiskCapUtil

节点最小磁盘使用率

%

实例所有节点磁盘使用率的最小值。

DiskUtilSkew

磁盘用量倾斜率

%

统计数据在各节点磁盘上分布的不均衡度,统计方式为:(节点最大磁盘使用率-节点最小磁盘使用率)/节点最大磁盘使用率

NodeMaxQueueCount

节点最大队列数

count

实例所有节点中的最大队列数量。

NodeMinQueueCount

节点最小队列数

count

实例所有节点中的最小队列数量。

QueueCountSkew

队列数倾斜率

%

统计队列数量在各节点上分布的不均衡度,统计方式为:(节点最大队列数-节点最小队列数)/节点最大队列数

NodeMaxProduceRate

节点最大生产速率

Count/s

实例所有节点的最大消息生产速率。

NodeMinProduceRate

节点最小生产速率

Count/s

实例所有节点的最小消息生产速率。

NodeProduceRateSkew

生产速率倾斜率

%

统计生产速率在各节点上分布的不均衡度,统计方式为:(节点最大生产速率-节点最小生产速率)/节点最大生产速率

NodeMaxConsumeRate

节点最大消费速率

Count/s

实例所有节点的最大消息消费速率。

NodeMinConsumeRate

节点最小消费速率

Count/s

实例所有节点的最小消息消费速率。

NodeConsumeRateSkew

消费速率倾斜率

%

统计消费请求在各节点上分布的不均衡度,统计方式为:(节点最大消费速率-节点最小消费速率)/节点最大消费速率

NodeMaxConnectionRate

节点最大连接数使用率

%

实例内所有节点最高连接数使用率。

NodeMinConnectionRate

节点最小连接数使用率

%

实例内所有主节点最小连接数使用率。

NodeConnectionRateSkew

连接数倾斜率

%

统计连接在各节点上分布的不均衡度,统计方式为:(节点最高连接使用率-节点最低连接使用率)/ 节点最高连接使用率。

主题

消息队列 RocketMQ版在主题(Topic)维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

MsgProductionRate

消息生产速率

Count/s

Topic 每秒收到的消息数。

MsgConsumptionRate

消息消费速率

Count/s

Topic 每秒被消费的消息数。

TopicProductionSizeRate

消息生产流量速率

Bytes/s

Topic每秒收到的流量。

TopicQueueSize

Topic队列数

Count

Topic 的队列数量。

TopicAccumulativeMessageCount

Topic累计生产消息量

Count

Topic累计生产消息量。

TopicMsgAvgSize

Topic消息平均大小

Bytes

topic消息的平均大小。
由于部分客户端会开启消息压缩,可能会导致监控数据小于实际消息大小。

消费组

消息队列 RocketMQ版在消费组(Group)维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

GroupMsgConsumptionRate

消费组消费速率

Count/s

消费组每秒消费的消息数。

GroupMsgAccum

消费组消息堆积数

Count

消费组的消息堆积量。

GroupTopicMsgConsumptionRate

Topic消息消费速率

Count/s

消费组对指定 Topic 每秒消费的消息数。

GroupTopicMsgAccum

Topic消息堆积数

Count

消费组对指定 Topic 的消息堆积数。

GroupOnlineConsumerCount

在线消费者数

Count

消费组在线的消费者数量。

GroupConsumeFailedMsgAccum

消费组消费失败数

Count

消费组消费失败的消息总数。

GroupConsumeFailedMsgRate

消费组消费失败速率

Count/s

消费组每秒钟消费失败的消息总数。

GroupConsumeCostTime

消费者消费耗时

ms

统计周期内所有消费者消费消息的平均耗时。

MessageBacklogDuration

消息堆积时长

ms

指定消费组订阅的每个Topic中未消费消息的最大堆积时间。

重试队列

消息队列 RocketMQ版在重试队列维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

RetryTopicMsg

重试Topic消息数

Count

重试 Topic 每分钟收到的消息数。

死信队列

消息队列 RocketMQ版在死信队列维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

DLQTotalMsg

死信Topic消息数

Count

死信 Topic 每分钟收到的消息数。

数据备份

消息队列 RocketMQ版在数据备份任务维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

BackupTaskStatus

备份任务状态

Count

指定数据备份任务的状态。

  • -1:错误
  • 0:停止
  • 1:运行

BackupTaskReadRate

备份任务读速率

Count/s

每个数据备份任务从备份数据源读取消息的速度。

BackupTaskWriteRate

备份任务写速率

Count/s

每个数据备份任务发送消息到备份目的端的速度。

BackupTaskReadTotal

备份任务累计读取消息条数

Count

每个备份任务累计从备份数据源读取消息的条数。

BackupTaskWriteTotal

备份任务累计备份消息条数

Count

每个备份任务累计向备份目的端备份的消息条数。

数据同步

消息队列 RocketMQ版在数据备份任务维度支持以下监控指标。

监控项 ID

监控项名称

单位

说明

ConnectorTaskStatus

同步任务状态

Count

指定数据同步任务的状态。

  • -1:错误
  • 0:停止
  • 1:运行

DataSyncTaskReadRate

同步任务读速率

Count/s

每个数据同步任务从数据源读取消息的速度。

DataSyncTaskWriteRate

同步任务写速率

Count/s

每个数据同步任务同步消息到目的端的速度。

DataSyncTaskReadTotal

同步任务累计读取消息条数

Count

每个同步任务累计从同步数据源读取消息的条数。

DataSyncTaskWriteTotal

同步任务累计同步消息条数

Count

每个同步任务累计向同步目的端同步的消息条数。