云拨测告警策略是一套告警模板,定义了告警触发规则与通知分发策略。一个告警策略可以关联多个拨测任务,实现对不同任务的集中管控与规则复用,提升告警管理效率。本文为您介绍如何创建告警策略。
操作步骤
- 登录云拨测控制台。
- 在左侧菜单栏选择 告警管理 > 告警策略。
- 在 告警策略 页面单击 创建告警策略。
- 在 创建告警策略 页面,依次完成以下配置:
- 配置基本信息
- 告警规则配置
- 通知规则配置
- 完成以上配置后,单击 创建告警策略。
成功创建告警策略后,您可以在告警策略列表中看到您创建的告警策略,状态为 已启用。

配置说明
基本信息配置
配置项 | 说明 |
---|
策略名称 | 为告警策略设置一个名称。名称长度不能超过 256 个字符。 |
所属项目 | 从下拉列表为告警策略选择一个项目。本次创建的资源将添加到对应项目中,并按项目维度进行统一管理。
如果您需要创建新的项目,单击 新建项目,具体操作请参见新建项目。 |
任务类型 | 选择告警策略所要关联的拨测任务类型,系统将据此筛选出对应类型的拨测任务。您可以从以下任务类型中进行选择 - HTTP(S)
- PING
- DNS
- TCP/UDP
- 文件传输
- 页面元素
|
拨测方式 | 选择任务所使用的拨测方式。 说明 当 任务类型 为 TCP/UDP 和 文件传输 时,需要设置拨测方式。 |
选择任务 | 选择需要关联的拨测任务。您可以通过 任务状态 或 任务组 进行筛选,也可以通过 任务名称 或 ID 进行搜索,以便快速找到目标拨测任务。 说明 如需创建新的拨测任务,单击 创建拨测任务。具体操作,请参见创建拨测任务。 |
配置告警规则
说明
在告警检测中,当某个指标无数据时,云拨测会在本次检测周期跳过这个指标的异常检测。
什么情况下指标会无数据?
- 对于时延类指标,如果拨测目标发生错误、超时的情况则无法测量时延。如果仅仅是时延指标的告警检测,可以在 数据过滤 配置过滤掉 可用性断言 为 不可用 的数据。
配置项 | 说明 |
---|
检测方式 | 您可以根据具体的需求和监控场景,选择合适的告警检测方式: - 固定阈值:固定阈值是一种静态的告警触发机制,其中阈值是预先设定的固定数值,指标值超出阈值则标记为异常。无论被监控指标如何变化,告警触发的条件都是基于这些固定数值。
- 动态阈值:动态阈值是一种更智能的告警触发机制,其中阈值是基于多种算法动态计算的,无需手动配置,实际值超出阈值范围则会被标记异常。这种方法考虑了数据的自然波动和趋势,能够适应数据的变化。
如果您的监控指标相对稳定,且您对性能有明确的预期,固定阈值可能是一个简单有效的选择。如果您的监控指标波动较大,或者您希望告警系统能够自适应数据变化,动态阈值可能更适合您的需求。 |
触发条件-固定阈值 | 您可以根据需要设置告警触发条件,以便在特定的性能指标超出预设阈值时获得通知。 - 告警触发条件:
- 时间周期:最近的拨测周期数量,您可以设置的范围是1到6个周期。
- 触发频率:表示在所选周期内满足告警条件的次数,设置范围为1到6次。
- 任意:在所选周期内,只要有一次满足告警条件,就会触发告警。
- 连续:在所选周期内,需要连续多次满足告警条件,才会触发告警。
- 满足条件的类型
- 任一:只要有一个监控指标满足告警条件,就会触发告警。
- 所有:所有监控指标都必须满足告警条件,才会触发告警。
例如,假设您设置告警条件为“在最近 5 个拨测周期,任意 1 次满足以下 所有 条件则触发相应告警”:表示云拨测将检查任务最近的5个连续的拨测周期的数据,只要有任意1次的检测结果满足后续设定的告警条件,就会触发告警。
- 监控指标:从下拉列表,选择触发告警的监控指标。您可以请前往指标体系页面了解相关指标的具体定义。
- 告警阈值:
- 普通告警阈值:为所选监控指标设置普通告警的阈值。当监控数据达到或超过此阈值时,将触发普通级别的告警。
- 严重告警阈值:为所选监控指标设置严重告警的阈值。当监控数据达到或超过此阈值时,将触发严重级别的告警。严重告警的阈值应设置得比普通告警更严格,以区分告警的严重程度。
- 添加更多指标:您可以单击 添加指标,根据需要设置其他监控指标及其告警阈值。
|
触发条件-动态阈值 | - 监控周期:设定一个监控周期,系统将根据这个周期内的历史数据来动态计算阈值。
- 监控指标:选择一个监控指标。目前支持的监控指标包括 可用率 或 PING可用率,每次只能选择其中一个。
说明 只有选择 PING 类型的拨测任务时,才会同时出现 可用率 和 PING可用率。
例如,假设您选择了“可用率”作为监控指标,并设置了2分钟为一个监控周期。系统将分析过去2分钟内的可用率数据,计算出一个合理的阈值范围。如果在未来2分钟内,可用率数据超出了这个动态计算的阈值范围,系统将触发告警。 |
数据过滤 | 筛选出符合条件的拨测数据进行告警检测。
例如,当您需要针对特定的节点运营商设置告警阈值时,可以通过数据过滤来实现。从下拉列表选择 节点运营商 包含 "中国移动"。 |
分组检测 | - 不分组(默认):所有节点的拨测数据求平均值,对该值进行告警检测。这种方式适用于整体性能监控,但可能无法反映局部问题。
- 分组监控:将数据按照特定的维度进行分组,然后对每个分组的数据单独进行告警检测。这种方法可以帮助您更细致地了解不同分组的性能表现,从而更有效地识别和解决问题。
- 支持的分组维度:
- 国家
- 节点国家-省份
- 节点国家-省份-运营商
- 节点运营商
- 节点城市
|
配置通知规则
配置项 | 说明 |
---|
通知方式 | 选择告警通知接收对象。您可以选择一种或多种接收对象,支持选择: |
联系人 | 说明 当 通知方式 选择了 联系人 时,才需要配置。 云拨测告警支持发送告警通知到指定联系人。 - 选择联系人:
- 从下拉列表选择告警通知接收联系人。
- 在列表中可以看到当前联系人可用的接收告警方式(邮箱、短信或电话),如果需要修改联系人相关信息,可以单击其后的修改按钮。
- 单击 创建联系人 可以新建联系人,具体操作,请参考创建联系人。
- 严重告警渠道:支持 邮件、短信 或 电话。
- 普通告警渠道:支持 邮件、短信 或 电话。
|
团队 | 云拨测告警支持发送告警通知到团队。 - 选择团队:
- 从下拉列表选择告警通知接收的团队。
- 在列表中可以看到当前团队可用的接收告警方式(飞书、钉钉或企业微信),如果需要修改团队相关信息,可以单击其后的修改按钮。
- 单击 创建团队 可以创建新的团队。具体操作,请参考创建团队。
- 通知方式:严重告警与普通告警为统一方式,支持 飞书 、钉钉 和 企业微信。
|
系统集成 | 云拨测告警支持发送告警通知到自定义对接系统。 - 从 选择对接系统 下拉列表选择告警通知接收的系统。
- 在列表中可以看到当前系统的回调 URL,如果需要修改系统相关信息,可以单击其后的修改按钮。
- 单击 创建系统 可以创建新的系统集成。具体操作,请参考系统集成。
- 通知方式:严重告警与普通告警为统一通知方式。
|
值班计划 | 云拨测告警支持发送告警通知到值班计划。 - 选择值班计划:从 选择值班计划 下拉列表选择接收告警通知的值班计划。
- 如果需要修改值班计划的相关配置,可以单击其后的修改按钮,并在 编辑值班计划 面板完成修改。具体操作,请参考修改值班计划配置。
说明 - 如果修改值班计划的 值班名称 或 备注,值班安排不受影响。
- 如果修改值班计划的 值班轮换周期、开始日期 或 值班班次,系统将重新调整未来值班安排,已执行的值班记录不变。
- 单击 创建值班 可以创建新的值班计划。具体操作,请参考创建值班计划。
- 严重告警渠道:支持 邮件、短信 或 电话。
- 普通告警渠道:支持 邮件、短信 或 电话。
|
聚合通知 | 开启后,如果 1 分钟内触发多次告警,云拨测把 1 分钟内的全部告警通知聚合为 2 条告警通知。 - 第 1 条通知是该分钟内产生的第 1 个告警的明细。该通知的告警等级为该告警的等级。
- 第 2 条通知是该分钟内产生的所有告警的汇总。该通知的告警等级为普通告警。
|
通知降频 | 开启后,如果一个告警连续重复触发,告警通知间隔会逐步递增至 5 分钟、10 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时、24 小时。
例如,告警通知间隔为 30 秒,则第二次触发时通知间隔增加至 5 分钟,第三次 10 分钟,第四次 30 分钟。 |
通知时间 | 设置发送告警通知的时间范围。 |
相关操作
管理告警策略