如果您需要监控某一云产品资源的数据状态,则可以创建云监控告警策略。当被监控的云产品资源数据达到告警的触发条件时,系统会通过您指定的方式推送告警通知,便于您及时发现存在异常数据的资源。
使用限制
- 当告警对象选择关联某地域下的全部资源时,无数量限制。
- 当告警对象选择关联某地域下的部分资源时,有以下数量限制。
- 1个告警策略的告警对象里,同一种资源类型最多添加1000个资源。
- 1个告警策略的告警对象里,所有资源类型总共最多5000个。
前提条件
创建告警策略
- 登录云监控控制台。
- 在左侧导航栏,选择告警中心 > 告警策略。
- 在告警策略页面,单击创建告警策略。
- 在创建告警策略页面,完成以下配置,然后单击确定。
配置项说明:
基本信息
配置项 | 说明 |
---|
名称 | 自定义告警策略名称,用于标识告警策略。 |
描述 | 自定义告警策略的说明性信息。 |
告警对象
配置项 | 说明 |
---|
资源类型 | 指定被监控的云产品类型。支持的云产品类型请以控制台实际信息为准。 |
地域 | 被监控资源所属的地域。 |
维度 | 指定被监控的云产品的资源维度。 |
资源 | 设置告警策略作用的资源范围,即仅在该资源范围内进行监控。支持以下任一设置: - 全部:表示对当前账号下,符合指定资源类型、地域以及维度的所有资源设置告警策略。
选择后,符合条件的新建资源也会自动匹配该告警策略。 - 部分:您需要手动选择一个或多个资源。
选择后,表示仅对该部分资源设置告警策略。
|
说明
云产品类型不同,可选择的地域、维度等信息也不完全相同。请您以控制台实际信息为准。
告警规则
配置项 | 说明 |
---|
使用预置触发条件 | 控制台按照告警维度预先配置的触发条件,便于您快速填写告警策略。包含指标类型和触发条件。 - 指标类型为多指标时,支持使用预置触发条件。
- 勾选使用预置触发条件,自动填充指标类型和触发条件,支持修改、删除和增加。
- 如果维度没有设置预置触发条件,则无法勾选使用预置触发条件。
|
指标类型 | 选择指标类型,支持选择单指标或多指标。如果您需要监控资源的多个指标,可直接配置多指标类型。 |
触发条件 | 设置告警的监控指标、持续周期、统计类型、比较关系以及阈值。当被监控的资源指标达到触发条件时,系统会推送告警通知。 - 如果指标类型设置为单指标,则仅支持设置一个触发条件。
- 如果指标类型设置为多指标,则支持设置一个或多个触发条件。
说明 多指标的触发条件: - 支持设置满足全部条件后触发或满足任意条件后触发。
- 触发条件至少设置1条,至多设置10条。
- 不支持重复设置相同的触发条件。
- 一条规则同时触发阈值告警或无数据告警,则会分别发送两条通知。
例如,触发条件为磁盘使用率平均值>80%,持续10个周期(1周期=1分钟) ,表示系统以1分钟为周期检测资源指标,如果某资源连续10分钟磁盘使用率的平均值大于80%,则触发告警。
|
告警级别 | 标识告警的严重程度。支持设置严重、警告、通知。 |
生效时间 | 配置告警策略的生效时间。告警策略只在生效时间内监控资源的数据是否达到触发条件。 |
告警发送周期 | 触发告警策略后,如果被监控的资源仍然持续触发告警,为避免打扰,系统会周期性发送告警通知。 - 支持配置为5分钟、10分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时、24小时。
- 默认为5分钟。
|
发送聚合策略 | - 规则:告警规则中的任意资源在告警发送周期内持续超过告警阈值,在告警发送周期内只发送1次告警通知。
- 规则和资源:告警规则中的不同资源在告警发送周期内持续超过告警阈值,在告警发送周期内均会分别发送告警通知;如果监控指标在告警发送周期后仍未恢复正常,则云监控再次发送告警通知。
|
告警恢复通知 | 告警恢复后向用户发送一条恢复通知,默认为打开。 注意 - 告警场景中,资源连续5分钟不产生告警,视为恢复。
- 无数据告警场景中,资源连续5分钟恢复数据上报,视为恢复。
- 发送聚合策略选择规则时,所有资源的告警都恢复后,发送一条告警恢复通知。
- 发送聚合策略选择规则和资源时,每个资源的告警恢复后,都会发送一条告警恢复通知。
|
无数据告警 | 资源连续指定n个周期,无数据上报,则会触发无数据告警。 注意 - 支持配置3~20个周期,默认为10个周期。
- 不是所有的云产品指标都支持无数据告警。目前只有告警规则里维度为实例,且资源只涉及一个层级的云产品指标可以配置无数据告警,以控制台显示为准。
- 一条规则同时触发阈值告警或无数据告警,则会分别发送两条通知。
- 资源被删除不发送无数据告警通知。
例如,告警规则中配置了全部资源。A资源被删除,连续n个周期没有上报数据,不发送无数据告警。
|
告警方式
配置项 | 说明 |
---|
告警渠道 | 选择一个或多个渠道。支持邮箱、电话、短信以及告警回调。
其中,电话和短信通知的接收限制,请参见使用限制。 |
告警联系组 | 当告警渠道选择邮箱、电话或者短信中的一个或多个渠道时,页面将展示告警联系组。 - 必须设置至少1个联系组作为告警通知的接收方。
- 至多设置5个联系组作为告警通知的接收方。
|
告警回调 | 当告警渠道选择告警回调时,页面将展示告警回调文本框。 - 必须指定一个公网可用的URL。后续如果资源触发告警策略,则系统会把告警的详细信息通过POST请求发送至该URL,便于您进行深入的数据分析。
- 支持选择已创建的回调地址,最多选择8个。
- 支持填写回调地址,只能填写1个。
- 建议您准备一台已开启HTTP服务且能在公网访问的服务器,然后将服务器的HTTP URL设置为告警回调URL。
- 关于告警回调的更多信息,请参见告警回调使用说明。
- 告警回调支持关联飞书、钉钉、企业微信中的群机器人,以实现自动推送告警通知。具体操作,请参见通过飞书群接收告警通知、通过钉钉群接收告警通知、通过微信群接收告警通知。
|
后续步骤
您可以查看并管理创建完成的告警策略。具体操作,请参见查看告警策略。