You need to enable JavaScript to run this app.
导航

报警管理

最近更新时间2023.09.25 17:28:43

首次发布时间2022.06.20 11:34:32

报警任务分PC崩溃、事件指标等。每一类报警任务的配置方式类似,指标有所不同。

  • 报警任务支持配置崩溃错误指标、自定义事件指标的报警策略。
    • 支持配置多个报警策略,支持策略之前的与和或
    • 支持样本量阈值配置,避免样本过少,报警不具有代表性
    • 提供报警生效时间和报警开关,支持只在对应时间段中生效
  • 报警信息可配置飞书、邮件、企业微信、钉钉等渠道,不错过任何紧急情况,灵活设置接收人。
  • 报警历史以大盘视角查看整体报警统计的信息和趋势,便于优化调整报警规则和策略。

新建报警任务

以崩溃报警为例,介绍如何新建报警任务。

  1. 登录应用性能监控全链路版控制台

  2. 单击目标应用下的PC端监控

  3. 在控制台左上角选择全部功能 > 报警任务

  4. 报警任务页面,单击新建报警任务

  5. 新建报警任务页面,完成以下配置,然后单击保存

    配置区域

    配置项

    说明

    报警基本信息

    报警任务名称

    报警任务的名称。

    报警级别

    支持WarningFatal两个级别。

    报警说明

    报警任务的说明。

    制定报警策略

    报警类型

    不同报警类型对应不同报警指标,目前已支持的报警类型如下:PC崩溃、事件指标。

    任务执行间隔

    任务执行间隔指后端轮询服务的运行频率。
    比如配置 5 分钟的间隔,那么每 5 分钟都会检测一次最近一段时间内的指标值是否满足报警阈值。

    多策略关系

    当配置多个策略关系时,可以配置策略之间的关系

    • 同时满足以下规则(默认):多个策略同时满足才报警
    • 满足下述任一规则:多个策略满足一个就报警

    报警指标

    • 指标:不同报警类型下有不同的指标。
    • 筛选条件:
      • 阈值:单个时间窗口内异常数目达到一定量,就会触发报警
      • 比:指单个时间窗口内,相对 n 个时间单位前同一时间窗口内的值,上涨或下跌幅度是否超过设置的值
    • 样本量阈值:上报的样本量达到一定数量,才会触发报警,避免样本过少,报警不具有代表性。
    • 分组:维度内容与过滤项相同,例如选择版本,则每一版本达到报警条件,都会单独触发一次报警。

    报警生效时间

    配置报警生效时间段。配置完成后,报警只在对应时间段中生效。

    配置通知受众

    报警方式

    支持的报警方式:飞书邮件企业微信钉钉

    邮件接收组

    配置邮件接收组。

报警详情

进入方式

  • 通过单击报警列表中的报警详情进入
  • 通过推送的报警消息链接进入

ACK 操作

支持设置报警 ACK,ACK 生效时间可与详情页调整。

  1. ACK 只屏蔽报警通知,但报警事件依旧正常生成,规则依然处于生效状态。
  2. 初始状态为ACK,用户可修改单次ACK默认屏蔽时长。
  3. 单击ACK后,自动设定到期时间,同时按钮状态为重置ACK
  4. 在用户确认过ACK的屏蔽时间内,可以随时重置ACK,倒计时刷新。
  5. 屏蔽时间结束后,按钮状态恢复ACK

报警历史

详情页下方,展示当前报警配置的所有报警记录列表。