You need to enable JavaScript to run this app.
导航

告警原理

最近更新时间2024.03.04 19:16:03

首次发布时间2023.12.07 15:09:16

本文介绍创建告警策略后,告警触发、执行和恢复的详细流程。

告警流程

指标达到阈值

例如,用户在告警策略中配置的告警触发条件为:

  • 磁盘读写带宽持续1个周期,平均值大于58MiB/s。
  • 磁盘读写带宽持续1个周期,最大值大于58MiB/s。
  • 磁盘读写带宽持续1个周期,最小值大于58MiB/s。

如下图所示,原始值以30s为上报周期,告警检测每分钟执行一次,告警检测时取过去1min的原始值应用max、avg、min聚合计算得到相应的最大值、平均值及最小值。
例如12:06的平均值由12:05:30和12:06:00两个点求平均得到,最大值、最小值计算方式以此类推。
图片
告警流程详情如下:

触发条件

计算指标

告警检测时间

告警恢复

12:04

12:05

12:06

12:07

12:08

12:09

12:10

12:11

···

12:15

磁盘读写带宽持续1个周期,最大值大于58MiB/s

最大值

未超过阈值

超过阈值,触发告警

指标一直高于阈值,告警未恢复

磁盘读写带宽持续1个周期,平均值大于58MiB/s

平均值

未超过阈值

超过阈值,触发告警

低于阈值

连续5个周期没有告警,告警恢复

12:15按照配置方式进发送恢复通知

磁盘读写带宽持续1个周期,最小值大于58MiB/s

最小值

未超过阈值

未触发告警

指标环比达到阈值

例如,用户在告警策略中配置的告警触发条件为:

  • 磁盘读写带宽平均值持续3个周期,环比上升/下降10%。

如下图所示,原始值以30s为上报周期,告警每分钟检测一次,告警检测时取当前周期(过去1min)的原始值应用avg聚合计算得到平均值,再与前一个周期的平均值计算环比。

图片
告警流程详情如下:

触发条件

计算指标

告警检测时间

告警恢复

12:04

12:05

12:06

12:07

12:08

...

12:12

磁盘读写带宽平均值持续3个周期,环比上升/下降10%。

平均值环比

指标满足告警阈值,但未满足连续3个周期,不触发告警

指标满足告警阈值,且满足连续3个周期,触发告警

不满足告警阈值

连续五个周期未触发告警,告警恢复

按照配置方式发送恢复通知

极端场景说明

环比 = (第n个周期 - 第n-1个周期)/第n-1个周期

n-1个周期的数据n个周期的数据说明
0不为0环比变化无限大,大于任何阈值设定。本周期触发条件。
无上报无上报或上报任意值无法计算环比。本周期未达到触发条件。
无上报或上报任意值无上报无法计算环比。本周期未达到触发条件。
n0环比=-1=-100%。本周期未达到触发条件。
00环比无变化。本周期未达到触发条件。

同比昨天 = (当前相同周期 - 昨天相同周期)/昨天相同周期
同比上周 = (当前相同周期 - 上周相同周期)/上周相同周期

昨天相同周期/上周相同周期/上一周期的数据当前周期的数据说明
0不为0同比变化无限大,大于任何阈值设定。本周期触发条件。
无上报无上报或上报任意值无法计算同比。本周期未达到触发条件。
无上报或上报任意值无上报无法计算同比。本周期未达到触发条件。
n0同比=-1=-100%。本周期未达到触发条件。
00同比无变化。本周期未达到触发条件。