You need to enable JavaScript to run this app.
导航
监控指标说明
最近更新时间:2024.07.17 11:01:21首次发布时间:2022.05.07 16:48:21

云数据库 PostgreSQL 版的监控告警功能为节点提供了四类监控,分别是资源监控、引擎监控、部署监控和代理监控。每类监控的监控指标如下表所示。

说明

  • 为方便显示,监控告警图表会根据数据量自动调整单位量级,具体以显示为准。例如,在复制延迟大时,会将单位从 μs 调整为 ms;在复制延迟更大时,则会将单位从 ms 调整为 s。

  • 您可以调用 GetMetricData 接口查询各监控指标数据和告警信息。调用该查询接口时,需要获取产品的 Namespace、待查询指标所属的 SubNamespace 和待查询指标 MetricName。云数据库 PostgreSQL 版的 Namespace 为 VCM_RDS_PostgreSQL,各指标的 MetricName 与 SubNamespace 如下表所示。

  • 您也可以在云数据库 PostgreSQL 版监控指标查询获取各个监控指标的详细信息。

指标名称监控指标MetricNameSubNamespace单位指标说明
资源监控CPU 使用率CPU 使用率CpuUtilresource_monitorPercent
内存使用率内存使用率MemUtilresource_monitorPercent允许闲时超用,内存利用率可能大于 100%。
磁盘使用率磁盘使用率DiskUtilresource_monitorPercent磁盘使用空间在实例购买空间的占比。
用户态 CPU 使用率用户态 CPU 使用率UserCPUUtilresource_monitorPercent用户态的 CPU 使用率,是 CPU 使用率的组成部分之一。
系统态 CPU 使用率系统态 CPU 使用率SysCPUUtilresource_monitorPercent系统态的 CPU 使用率,是 CPU 使用率的组成部分之一。
RSS 内存使用量RSS 内存使用量RSSMemUsageresource_monitorBytes(SI)实例实际占用的物理内存大小。
缓存内存使用量Cache 内存使用量CacheMemUsageresource_monitorBytes(SI)文件系统缓存使用的内存量。
网络输入流量网络输入流量NetworkReceiveThroughputresource_monitorBytes/Second(SI)PostgreSQL 内核统计到的输入流量。
网络输出流量网络输出流量NetworkTransmitThroughputresource_monitorBytes/Second(SI)PostgreSQL 内核统计到的输出流量。
磁盘使用量磁盘使用量DiskUsageresource_monitorBytes(SI)磁盘使用空间的总大小。
数据文件磁盘使用量数据文件磁盘使用量BaseDiskUsageresource_monitorBytes(SI)PostgreSQL 实例中数据资源所占用磁盘大小。
WAL 日志磁盘使用量Wal 日志磁盘使用量WalDiskUsageresource_monitorBytes(SI)PostgreSQL 实例中 WAL 日志所占用磁盘大小。
运行日志磁盘使用量运行日志磁盘使用量LogDiskUsageresource_monitorBytes(SI)PostgreSQL 实例中运行日志所占用磁盘大小,包含错误日志、慢日志等,用于作为审计数据来源
临时文件磁盘使用量临时文件磁盘使用量TempFileDiskUsageresource_monitorBytes(SI)PostgreSQL 实例中 pgsql_tmp 目录所占用磁盘的大小,用于存储执行 SQL 时所产生的临时数据。

数据库大小

说明

仅用于配置告警策略,不提供看板展示。

DBSize

resource_monitor

Bytes(SI)

以 database 为单位,监控该数据库的数据资源所占用磁盘大小。

数据库膨胀率DBExpansionRateresource_monitorBytes/Second(SI)以 database 为单位,监控该数据库的数据资源所占用磁盘大小的膨胀速率。
复制槽最大 WAL 堆积量SlotMaxWALAccumulationresource_monitorBytes(SI)当前实例所有复制槽中堆积的 WAL 日志量的最大值。
非活跃状态复制槽个数InactiveSlotCountresource_monitorNone未处于活跃状态的复制槽的个数。
引擎监控每秒事务数TPSTPSengine_monitorCount/Second
连接数使用率连接使用率ConnectionUsedUtilengine_monitorPercent当前实例的所有连接数量占用最大连接数的使用比例。
当前总连接数总连接数TotalConnectionengine_monitorCount当前实例的所有连接数量,包括活跃状态和非活跃状态。
每秒慢查询数每秒慢查询数量变化趋势SlowQueriesengine_monitorCount/Second每秒内查询时间超过 log_min_duration_statement 参数所设置时长的查询的个数。
每 30s 慢查询增量每30秒慢查询增量变化趋势SlowQueriesIncrementengine_monitorCount查询时间超过 log_min_duration_statement 参数所设置时长的查询的数量变化趋势。
每秒插入行数每秒插入行数RowsInsertedengine_monitorCount/Second每秒插入的行数。
每秒删除行数每秒删除行数RowsDeletedengine_monitorCount/Second每秒更新的行数。
每秒更新行数每秒更新行数RowsUpdatedengine_monitorCount/Second每秒删除的行数。
当前活跃连接数当前活跃连接数ActiveConnectionengine_monitorCount当前数据库正在执行的客户端进程总数。
当前空闲连接数当前空闲连接数IdleConnectionengine_monitorCount当前数据库已申请但未使用的客户端进程总数。
当前不活跃事务数当前不活跃事务数IdleInTxnConnectionengine_monitorCount当前数据库处于事务中未使用的客户端线程总数。
每秒事务提交数每秒事务提交数CommitsPerSecondengine_monitorCount/SecondPostgreSQL 实例中每秒钟发生的事务被提交(Commit)的次数
每秒事务回滚数每秒事务回滚数RollbacksPerSecondengine_monitorCount/SecondPostgreSQL 实例中每秒钟发生的事务被回滚(Rollback)的次数。
当前最长事务已执行时间当前最长事务已执行时间LongestTransactionExecTimeengine_monitorSecondPostgreSQL 实例中正在执行的查询中,最长的语句的执行时间。

数据库最大年龄 Xids

说明

仅用于配置告警策略,不提供看板展示。

DbMaxAgeXids

engine_monitor

None

当前实例中数据库最大年龄,如果值过大,会造成事务回卷,事务回卷期间实例不可写入

全局只读状态ReadOnlyStatusengine_monitorNone当前实例是否开启了全局只读参数,处于不可写状态
当前锁等待数锁状态 > 当前锁等待数LocksUngrantedCountengine_monitorCount以 database 为单位,检测当前正在等待释放的锁的总量。
当前锁持有数锁状态 > 当前锁持有数LocksGrantedCountengine_monitorCount以 database 为单位,检测当前正在已被授予的锁的总量。
每秒缓存命中数缓存命中统计 > 每秒缓存命中数SharedBuffersBlksHitengine_monitorCount/Second以 database 为单位,在缓冲区中发现磁盘块,而无需进行磁盘读取的次数。
当前缓存命中率缓存命中统计 > 当前缓存命中率SharedBuffersBlksHitRateengine_monitorPercent以 database 为单位,在缓冲区中发现磁盘块的次数占比。
主从复制延迟复制延迟ReplicationDelaydeploy_monitorSecond主从延迟时间。
代理 QPS代理 QPSProxyQPSproxy_monitorCount/Second数据库每秒执行的 SQL 数(含 INSERTSELECTUPDATE、和 DELETE)。
代理 CPU 使用率代理 CPU 使用率ProxyCPUUtilproxy_monitorPercent代理节点当前的 CPU 使用率。
代理内存使用率代理内存使用率ProxyMemUtilproxy_monitorPercent代理节点当前的内存使用率。
代理连接数代理连接数ProxyConnectionproxy_monitorCount当前打开的连接的数量。

说明

  • 关于 log_min_duration_statement 参数的设置,请参见修改参数
  • 如您实例的监控看板中没有用户态 CPU 使用率系统态 CPU 使用率两个监控指标,请提交工单申请升级实例版本。