You need to enable JavaScript to run this app.
导航

数据监控指南

最近更新时间2023.06.12 15:22:06

首次发布时间2022.10.17 21:23:46

本文介绍在使用缓存数据库 Redis 版时,需要重点关注的一些监控指标数据,帮助及时关注数据库的性能和稳定性问题。

监控指标分类

缓存数据库 Redis 版支持展示单个或聚合的代理(Proxy)节点或数据(Server)节点的监控数据。其中:

  • 代理节点和数据节点

    • 代理节点即 Proxy 节点,主要用于实现数据库读写分离、负载均衡等功能。在代理节点上,主要需要关注 CPU 使用率、连接数、QPS、等影响性能的监控指标。
    • 数据节点即 Server 节点,是真正提供数据库服务的节点。在数据节点上,主要需要关注 CPU 使用率、内存使用率、慢 SQL 和 Key 使用情况等监控指标。
  • 聚合指标和非聚合指标

    • 聚合指标能够反应整个实例当前的状态。建议优先查看聚合指标(如整个实例的 CPU 使用率、内存使用率、QPS、连接数、网络输入输出速率等)是否异常,帮助判断当前的负载是否已经超出了实例的承受范围。

    • 当出现实例整体负载不高但单个分片或节点负载较高(例如数据请求量、连接数等出现倾斜)时,聚合指标可能不会显示异常,此时便需要进一步查看非聚合指标。您可以通过单个分片或单个节点的监控指标是否存在明显异常来帮助排查问题。

需要关注的监控数据

说明

为及时获取重要指标的变动情况,建议根据业务需求选择合适指标设置报警规则。更多详情,请参见监控告警

分类监控指标项

性能

  • 代理节点的 QPS、CPU 使用率、请求响应延迟。
  • 数据节点的 CPU 使用率。

建议密切关注实例的 CPU 使用率,使用率过高会影响请求响应延迟,业务发送请求时可能会出现 IO 超时等报错。

容量

数据节点的内存使用率。
您可以通过 maxmemory-policy 参数设置缓存满后的 Key 删除策略,建议选择适合业务的策略,防止出现没有 Key 可以被驱逐而导致的内存容量不足问题。maxmemory-policy 参数设置的具体操作步骤,请参见设置 Key 的过期驱逐策略

连接数

代理节点的连接数。
每个缓存数据库 Redis 版实例或实例中的每个分片,默认会提供 10000 个连接。连接数使用达上限后,系统会拒绝新建的连接。若您需要使用更多的连接数,您可以修改最大连接数。具体操作步骤,请参见修改最大连接数

带宽

数据节点的网络输入带宽利用率、网络输出带宽利用率、网络峰值输入速率、网络峰值输出速率。
网络输入、输出带宽利用率过高会影响请求响应延迟,甚至会出现 IO 超时等报错。

其他

  • 数据节点上的 Key 命中率、过期或逐出 Key 数量等指标。
  • 慢日志。关于慢日志的更多详情,请参见查询慢日志
  • 大Key、热Key。关于大 Key 和热 Key 的更多详情,请参见大 Key 分析热 Key 分析