You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
合作与生态
支持与服务
开发者
了解我们
导航

报警模板

更新时间:2023.04.20 19:09:49

在报警模板中,报警规则和应用范围是相互独立的。您可以分别配置不同的报警规则和应用范围,快速生成报警任务。报警模版提供了报警规则的注入能力,解决了批量配置问题。

通过报警模板生成报警任务

报警规则和应用范围配置后,将交叉组合,自动生成报警任务。报警任务的生成逻辑:
图片
由于报警规则和应用范围是相互独立的,您可以在已配置的报警模板中单独编辑报警规则、或者单独编辑应用范围。当您同时编辑报警规则与应用范围,报警模板提交后对已生成的报警任务是否产生影响,是否生成新的报警任务,请参见以下说明。
编辑报警模板对已生成的报警任务是否产生影响:
图片
编辑报警模板是否生成新的报警任务
图片

创建报警模板

  1. 登录应用性能监控全链路版控制台

  2. 在左侧导航栏,单击服务端监控

  3. 选择开服region。

  4. 单击服务端监控旁边的点击进入服务端列表

  5. 在控制台左上角选择全部功能 > 报警模板

  6. 报警模板页面,单击创建报警模板
    图片

  7. 创建报警模板页面,完成配置,然后单击确定
    图片
    配置项说明:

    • 模板名称:自定义名称,用于标识该模板。
    • 模板类型:仅支持服务报警类型。
  8. 创建完成后,自动跳转到模板详情页,单击添加报警规则
    图片

  9. 新建报警规则页面,完成配置,然后单击保存
    图片
    配置项说明:

    配置区域

    配置项

    说明

    基本信息

    报警规则名称

    自定义名称,用于标识报警规则。

    报警策略

    报警级别

    报警级别支持多选,支持对不同的指标值设置不同的报警级别。

    • Notice:提示
    • Warn:警告
    • Fatal:严重

    报警引擎

    阈值引擎。

    多策略关系

    当配置多个策略关系时,可以配置策略之间的关系。

    • 同时满足:默认配置,多个策略同时满足才报警。
    • 满足一项:多个策略满足一个就报警。

    报警触发策略

    • 报警查询:不同报警类型下有不同的指标。
      • 筛选条件:在指标基础上,添加筛选条件,定位更精准的数据。
        筛选条件包括:服务类型、服务名、接口名、下游服务类型、下游服务名、下游接口名、状态码、主机、进程id。
      • 分组:支持多维度的分组。
        开启分组告警后,任意分组满足报警条件则触发报警。例如有多个服务,开启服务分组,任一服务满足告警阈值则触发告警。使用此功能可用一条报警规则实现对所有分组的监控告警。
    • 触发条件:AVG/SUM/MAX/MIN值在一定时间内达到设置的取值。
      • AVG:N分钟内指标的平均值
      • SUM:N分钟内指标的和
      • MAX:N分钟内指标的最大值
      • MIN:N分钟内指标的最小值
      • 阈值:单个时间窗口内异常数目达到一定量,就会触发报警。
      • :指单个时间窗口内,相对n个时间单位前同一时间窗口内的值,上升或下降幅度是否超过设置的值。

    无数据策略

    没有数据的处理方式。

    • 忽略
    • 通知无数据

    自定义tag

    自定义tag和取值。可以在告警列表根据tag进行筛选。

    报警发送策略

    规则运行频率

    设置规则每几分钟/次的运行频率。默认为1分钟/次。

    发送策略

    • 设置发送周期,默认为1分钟为一个发送周期。
    • 设置一个发送周期内触发的第几次报警,用于发送报警通知。默认为一个发送周期内触发1次,则第1次发送报警。

    发送降频

    打开时,如报警连续触发则发送间隔会逐步衰减变长。
    衰减策略为:下次发送周期=本次发送周期*2。例如,第一次发送周期为1分钟,第二次发送周期为2分钟,第三次发送周期为4分钟,第四次发送周期为8分钟,以此类推。

    报警批次聚合间隔

    设置将间隔不超过n分钟的报警聚合。

    • 一个报警产生时,如果检查前n分钟内存在报警,那么跟前n分钟的报警合并在一个告警组。
    • 一个报警产生时,如果检查前n分钟内没有报警,那么重新生成一个告警组,不跟前n分钟的报警合并。
  10. 单击应用范围页签,单击添加应用范围
    图片

  11. 应用到服务页面,完成配置,然后单击确定
    图片
    配置项说明:

配置区域

配置项

说明

选择服务

语言

通过服务的语言进行筛选。例如,Go、Java。

监控系统

通过监控系统进行筛选。例如,APMPlus、OpenTelemetry。

服务类型

通过服务类型进行筛选。例如,http、consumer。

服务

选择需要报警模板应用到哪些服务。

通知方式

报警方式

支持通过邮件飞书Webhook报警回调进行报警。

邮件通知人/组

配置邮件通知人或者通知组,出现报警时接收人或者接收组可以接收通知。报警方式选择邮件时,此项必填。

升级通知人/组

配置邮件通知人或者通知组,30分钟内发送5次告警且未ACK时接收人或者接收组可以接收通知。报警方式选择邮件时,此项选填。

飞书webhook

配置飞书Webhook地址。报警方式选择飞书Webhook时,此项必填。
webhook配置详见如何进行webhook配置?

告警回调

配置公网可访问的URL,会将报警信息通过POST请求推送到该地址。报警方式选择报警回调时,此项必填。

  1. 回到模板详情页面,单击提交
    图片
  2. 提交对话框中,单击确定,控制台将自动生成报警任务。

编辑报警模板

  1. 登录应用性能监控全链路版控制台
  2. 在左侧导航栏,单击服务端监控
  3. 选择开服region。
  4. 单击服务端监控旁边的点击进入服务端列表
  5. 在控制台左上角选择全部功能 > 报警模板
  6. 在报警模板列表中,找到目标模板,在其右侧操作列,单击编辑
    图片
  7. 编辑报警规则。
    • 添加报警规则
      详细操作和配置项说明,请参见 创建报警模板
    • 变更已有的报警规则
      1. 报警规则页面,找到目标报警规则,在其右侧操作列单击编辑
        图片
      2. 编辑报警规则页面,修改配置,然后单击保存
      3. 选择变更方式对话框中,选择变更方式,然后单击提交按钮。
        图片
    • 删除已有的报警规则
      1. 报警规则页面,找到目标报警规则,在其右侧操作列单击删除
        图片
      2. 删除报警规则页面,选择和关联报警任务的关系,然后单击确认删除
        图片
  8. 编辑应用范围。
    • 添加应用范围
      详细操作和配置项说明,请参见 创建报警模板
    • 变更已有的应用范围
      1. 单击应用范围页签,找到目标应用范围,在其右侧操作列单击编辑
        图片
      2. 应用到服务页面,修改配置,然后单击确定
      3. 选择变更方式对话框中,选择变更方式,然后单击提交按钮。
        图片
    • 删除已有的应用范围
      1. 应用范围页面,找到目标应用范围,在其右侧操作列单击删除
        图片
      2. 删除应用范围页面,选择和关联报警任务的关系,然后单击确认删除
        图片
  9. 回到模板详情页面,单击提交
    图片
  10. 提交对话框中,单击确定

删除报警模板

注意

删除报警模板,对应的报警规则、应用范围以及报警任务会同步删除,请谨慎操作。

  1. 登录应用性能监控全链路版控制台
  2. 在左侧导航栏,单击服务端监控
  3. 选择开服region。
  4. 单击服务端监控旁边的点击进入服务端列表
  5. 在控制台左上角选择全部功能 > 报警模板
  6. 在报警模板列表中,找到目标模板,在其右侧操作列,单击删除
    图片
  7. 删除报警模板对话框,选择与关联报警任务的关系,然后单击确认删除
    图片
    • 删除模板,解绑报警任务:删除该报警模板,保留报警模板生成的报警任务。
    • 删除模板和关联报警任务:删除该报警模板,删除报警模板生成的报警任务。