一. 概述
Feature 和 实验发布之后,即等同于发布了新版本,即使是小流量实验,也意味着可能对线上业务产生影响。该模块提供了报警监控的能力,可以对上线之后的功能进行监控,当业务指标或技术指标出现变动时,报警任务会及时触达到对应的负责人。
二. 创建报警
1. 新建报警任务
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_baf57f1b93865d386ad9fcf0178f23ce.png)
2. 选择报警类型
总共有两种报警类型:大盘报警和实验报警
- 大盘报警:系统会根据整体大盘数据触发报警
- 实验报警:系统会将关联实验关联的数据整合成指标,按照指标定制报警
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_548dbcea6953e5cf859e28e6c5be3859.png)
3. 报警任务-基本配置
- 基本信息:填写任务名称、任务说明等
- 报警等级:可以选择对应的报警等级(注意、警告、危急)
- 任务间隔:1小时、24小时,每隔所选间隔时间就会完成一次报警策略的计算,以判断是否要报警
- 关联场景:对应所选的报警场景
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_44426889bc076ae5cee937a98ffaadab.png)
4. 报警任务-设置报警策略
大盘报警 | 实验报警 |
---|
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_697bc794c6fdc56240a6605bcdc08f07.png)
| ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_b5d6268e3d07994faeae574a64bb69e8.png)
|
- 选择报警规则: 同时满足以下规则 代表只有满足所有报警策略的情况下才会触发报警; 满足下述一条规则 代表只要满足其中一个报警策略就会触发报警
- 报警策略:支持绝对数值、同比、环比的报警策略
| - 选择报警规则:同大盘报警
- 报警策略:仅支持对比对照组的报警策略
- 变化显著时报警:只有数据变化存在统计学显著的概念才会触发报警
|
5. 报警任务-通知方式配置
报警方式:飞书、钉钉、企业微信、邮件
- 飞书:进入飞书群组中,打开会话设置,找到群机器人,并点击添加机器人。选择 自定义机器人 加入群组
- 企业微信:进入微信群聊中,打开会话设置,找到群机器人,并点击右上角的添加,选择 机器人 添加到群聊
- 钉钉:打开机器人管理页面。以PC端为例,打开PC端钉钉,点击头像,选择机器人管理。在机器人管理页面选择自定义机器人。在配置安全设置时,选择自定义关键词,填写报警作为关键词,否则可能会造成报警信息丢失
- 完成机器人配置后,将对应WebHook地址复制进对应输入框,并妥善保存好此地址,避免地址泄露后被恶意调用发送垃圾消息
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_e9fbbecb7b557e8fa502b14bd9b1c04d.png)
三. 报警任务管理
点击任务名称进入任务详情可以进行修改
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_9b078dc633f5910ca2c0d3a3a4045d23.png)
四. 接收组管理
在接收组中可以创建、编辑、删除接收组
![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_e96b5bffc6469cf7ef8ea96aea3b5b2e.png)