You need to enable JavaScript to run this app.
导航

报警模板

最近更新时间2023.09.12 11:29:52

首次发布时间2022.12.27 16:15:28

在报警模板中,报警规则和应用范围是相互独立的。您可以分别配置不同的报警规则和应用范围,快速生成报警任务。报警模版提供了报警规则的注入能力,解决了批量配置问题。

通过报警模板生成报警任务

报警规则和应用范围配置后,将交叉组合,自动生成报警任务。报警任务的生成逻辑:
图片
由于报警规则和应用范围是相互独立的,您可以在已配置的报警模板中单独编辑报警规则或者单独编辑应用范围。当您同时编辑报警规则与应用范围,报警模板提交后是否影响已生成的报警任务,是否生成新的报警任务,请参见以下说明。
编辑报警模板对已生成的报警任务是否产生影响:
图片
编辑报警模板是否生成新的报警任务
图片

创建报警模板

  1. 登录应用性能监控全链路版控制台

  2. 在左侧导航栏,单击服务端监控

  3. 选择开服地域。

  4. 单击服务端监控旁边的点击进入服务端列表

  5. 在控制台左上角选择全部功能 > 报警模板

  6. 报警模板页面,单击创建报警模板
    图片

  7. 创建报警模板页面,完成配置,然后单击确定
    图片
    配置项说明:

    • 模板名称:自定义名称,用于标识该模板。
    • 模板类型:仅支持服务报警类型。
      创建完成后,自动跳转到模板详情页。
  8. 单击添加报警规则
    图片

  9. 新建报警规则页面,完成配置,然后单击保存
    图片
    配置项说明:

    配置区域

    配置项

    说明

    基本信息

    报警规则名称

    自定义名称,用于标识报警规则。

    报警策略

    报警级别

    报警级别支持多选,支持对不同的指标值设置不同的报警级别。

    • Notice:提示
    • Warn:警告
    • Fatal:严重

    报警引擎

    阈值引擎。

    多策略关系

    当配置多个策略关系时,可以配置策略之间的关系。

    • 同时满足:默认配置,多个策略同时满足才报警。
    • 满足一项:多个策略满足一个就报警。

    报警触发策略

    • 报警查询:不同报警类型下有不同的指标。
      • 筛选条件:在指标基础上,添加筛选条件,定位更精准的数据。
        筛选条件包括:服务类型、服务名、接口名、下游服务类型、下游服务名、下游接口名、状态码、主机、进程id。
      • 分组:支持多维度的分组。
        开启分组告警后,任意分组满足报警条件则触发报警。例如有多个服务,开启服务分组,任一服务满足告警阈值则触发告警。使用此功能可用一条报警规则实现对所有分组的监控告警。
    • 触发条件:AVG/SUM/MAX/MIN值在一定时间内达到设置的取值。
      • AVG:N分钟内指标的平均值
      • SUM:N分钟内指标的和
      • MAX:N分钟内指标的最大值
      • MIN:N分钟内指标的最小值
      • 阈值:单个时间窗口内异常数目达到一定量,就会触发报警。
      • :指单个时间窗口内,相对n个时间单位前同一时间窗口内的值,上升或下降幅度是否超过设置的值。

    无数据策略

    没有数据的处理方式。

    • 忽略
    • 通知无数据

    自定义tag

    自定义tag和取值。可以在告警列表根据tag进行筛选。

    报警发送策略

    规则运行频率

    设置规则运行频率(几分钟/次)。默认为1分钟/次。

    发送策略

    • 设置发送周期,默认为1分钟为一个发送周期。
    • 设置一个发送周期内触发的第几次报警,用于发送报警通知。默认为一个发送周期内触发1次,则第1次发送报警。

    发送降频

    打开时,如报警连续触发则发送间隔会逐步衰减变长。
    衰减策略为:下次发送周期=本次发送周期*2。例如,第一次发送周期为1分钟,第二次发送周期为2分钟,第三次发送周期为4分钟,第四次发送周期为8分钟,以此类推。

    报警批次聚合间隔

    设置将间隔不超过n分钟的报警聚合。

    • 一个报警产生时,如果检查前n分钟内存在报警,那么跟前n分钟的报警合并在一个告警组。
    • 一个报警产生时,如果检查前n分钟内没有报警,那么重新生成一个告警组,不跟前n分钟的报警合并。
  10. 单击应用范围页签,单击添加应用范围
    图片

  11. 应用到服务页面,完成配置,然后单击确定
    图片
    配置项说明:

配置区域

配置项

说明

选择服务

语言

通过服务的语言进行筛选。例如,Go、Java。

监控系统

通过监控系统进行筛选。例如,APMPlus、OpenTelemetry。

服务类型

通过服务类型进行筛选。例如,http、consumer。

服务

选择需要报警模板应用到哪些服务。

通知方式

报警方式

支持通过邮件飞书Webhook报警回调进行报警。

邮件通知人/组

配置邮件通知人或者通知组,出现报警时接收人或者接收组可以接收通知。报警方式选择邮件时,此项必填。

升级通知人/组

配置邮件通知人或者通知组,30分钟内发送5次告警且未ACK时接收人或者接收组可以接收通知。报警方式选择邮件时,此项选填。

飞书webhook

配置飞书Webhook地址。报警方式选择飞书Webhook时,此项必填。
webhook配置详见如何进行webhook配置?

告警回调

配置公网可访问的URL,会将报警信息通过POST请求推送到该地址。报警方式选择报警回调时,此项必填。

  1. 回到模板详情页面,单击提交
    图片
  2. 提交对话框中,单击确定,控制台将自动生成报警任务。

编辑报警模板

  1. 登录应用性能监控全链路版控制台

  2. 在左侧导航栏,单击服务端监控

  3. 选择开服地域。

  4. 单击服务端监控旁边的点击进入服务端列表

  5. 在控制台左上角选择全部功能 > 报警模板

  6. 在报警模板列表中,找到目标模板,在其右侧操作列,单击编辑
    图片

  7. 编辑报警规则。

    操作类别

    步骤

    添加报警规则

    详细操作和配置项说明,请参见创建报警模板

    变更已有的报警规则

    1. 报警规则页面,找到目标报警规则,在其右侧操作列单击编辑
      图片
    2. 编辑报警规则页面,修改配置,然后单击保存
    3. 选择变更方式对话框中,选择变更方式,然后单击提交按钮。

    删除已有的报警规则

    1. 报警规则页面,找到目标报警规则,在其右侧操作列单击删除
      图片
    2. 删除报警规则页面,选择和关联报警任务的关系,然后单击确认删除
      图片
  8. 编辑应用范围。

    操作类别

    步骤

    添加应用范围

    详细操作和配置项说明,请参见创建报警模板

    变更已有的应用范围

    1. 单击应用范围页签,找到目标应用范围,在其右侧操作列单击编辑
      图片
    2. 应用到服务页面,修改配置,然后单击确定
    3. 选择变更方式对话框中,选择变更方式,然后单击提交按钮。
      图片

    删除已有的应用范围

    1. 应用范围页面,找到目标应用范围,在其右侧操作列单击删除
      图片
    2. 删除应用范围页面,选择和关联报警任务的关系,然后单击确认删除
      图片
  9. 回到模板详情页面,单击提交
    图片

  10. 提交对话框中,单击确定

删除报警模板

注意

删除报警模板,对应的报警规则、应用范围以及报警任务会同步删除,请谨慎操作。

  1. 登录应用性能监控全链路版控制台
  2. 在左侧导航栏,单击服务端监控
  3. 选择开服地域。
  4. 单击服务端监控旁边的点击进入服务端列表
  5. 在控制台左上角选择全部功能 > 报警模板
  6. 在报警模板列表中,找到目标模板,在其右侧操作列,单击删除
    图片
  7. 删除报警模板对话框,选择与关联报警任务的关系,然后单击确认删除
    图片
    • 删除模板,解绑报警任务:删除该报警模板,保留报警模板生成的报警任务。
    • 删除模板和关联报警任务:删除该报警模板,删除报警模板生成的报警任务。