You need to enable JavaScript to run this app.
导航

使用告警中心

最近更新时间2024.05.06 10:45:58

首次发布时间2021.07.09 13:29:13

告警中心提供对监控指标的告警能力。您可以对云产品的重点监控指标设置告警策略,当指标数据改变或不符合预期时,系统会立即通知您异常信息,便于您第一时间采取措施。

步骤一:创建联系人

  1. 登录云监控控制台
  2. 在左侧导航栏,选择通知组 > 联系人
  3. 联系人页签,单击创建联系人
  4. 创建联系人页面,配置告警联系人的姓名邮箱或者手机,然后单击确定
    图片
  5. 设置邮箱或者手机并创建联系人后,云监控会向指定的邮箱或手机号码发送验证消息。
    以邮箱为例,验证消息内容如下图所示,您需要单击链接以完成验证。
    图片

步骤二:创建联系组

当您创建告警策略时,选择相应的联系组,即可通过联系组接收告警通知。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择通知组 > 联系人
  3. 单击联系组页签。
  4. 联系组页签内,单击创建联系组
  5. 创建联系组页面,配置联系组的名称描述,并选择联系人,然后单击确定
    图片

步骤三:创建回调地址

  1. 登录云监控控制台

  2. 在左侧导航栏,选择通知组 > 回调

  3. 回调地址列表页面,单击创建回调地址

  4. 创建回调地址页面,完成以下配置,然后单击确定
    图片
    配置项说明:

    配置项

    说明

    Webhook名称

    自定义Webhook名称,用于识别该回调地址。名称可以重复。

    回调地址类型

    选择回调地址类型。支持的类型有飞书、钉钉、企业微信和通用Webhook。

    回调地址

    输入公网可访问的URL,然后单击测试校验回调地址。

    • 当回调地址返回的响应HTTP Code为200时,显示联通性测试成功,表示该Webhook可以接收告警和事件通知。
    • 联通性测试限制QPS,1秒最多1次。

步骤四:创建告警策略

您可以自定义设置监控数据阈值、告警级别、告警策略的生效时间、告警发送的周期和通知方式等,灵活多样的策略,能够满足您不同业务场景的监控告警需求。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择通知组 > 告警策略
  3. 告警策略页面,单击创建告警策略
  4. 创建告警策略页面,完成以下配置,然后单击确定
    图片
    配置项说明:
    • 基本信息

      配置项

      说明

      名称

      自定义告警策略名称,用于标识告警策略。

      描述

      自定义告警策略的说明性信息。

    • 告警对象

      配置项

      说明

      资源类型

      指定被监控的云产品类型。支持的云产品类型请以控制台实际信息为准。

      地域

      被监控资源所属的地域。

      维度

      指定被监控的云产品的资源维度。

      资源

      设置告警策略作用的资源范围,即仅在该资源范围内进行监控。支持以下任一设置:

      • 全部:表示对当前账号下,符合指定资源类型、地域以及维度的所有资源设置告警策略。
        选择后,符合条件的新建资源也会自动匹配该告警策略。
      • 部分:您需要手动选择一个或多个资源。
        选择后,表示仅对该部分资源设置告警策略。

      说明

      云产品类型不同,可选择的地域、维度等信息也不完全相同。请您以控制台实际信息为准。

    • 告警规则

      配置项

      说明

      使用预置触发条件

      控制台按照告警维度预先配置的触发条件,便于您快速填写告警策略。包含指标类型和触发条件。

      • 指标类型为多指标时,支持使用预置触发条件。
      • 勾选使用预置触发条件,自动填充指标类型和触发条件,支持修改、删除和增加。
      • 如果维度没有设置预置触发条件,则无法勾选使用预置触发条件

      指标类型

      选择指标类型,支持选择单指标多指标。如果您需要监控资源的多个指标,可直接配置多指标类型。

      触发条件

      设置告警的监控指标、持续周期、统计类型、比较关系以及阈值。当被监控的资源指标达到触发条件时,系统会推送告警通知。

      • 如果指标类型设置为单指标,则仅支持设置一个触发条件。
      • 如果指标类型设置为多指标,则支持设置一个或多个触发条件。

        说明

        多指标的触发条件:

        • 支持设置满足全部条件后触发或满足任意条件后触发。
        • 触发条件至少设置1条,至多设置10条。
        • 不支持重复设置相同的触发条件。
        例如,触发条件为磁盘使用率平均值>80%,持续10个周期(1周期=1分钟),表示系统以1分钟为周期检测资源指标,如果某资源连续10个周期磁盘使用率的平均值大于80%,则触发告警。

      告警级别

      标识告警的严重程度。支持设置严重警告通知

      生效时间

      配置告警策略的生效时间。告警策略只在生效时间内监控资源的数据是否达到触发条件。

      告警发送周期

      触发告警策略后,如果被监控的资源仍然持续触发告警,为避免打扰,系统会周期性发送告警通知。

      • 支持配置为5分钟10分钟15分钟30分钟60分钟3小时6小时12小时24小时
      • 默认为5分钟。

      告警恢复通知

      告警恢复后向用户发送一条恢复通知,默认为打开。

      注意

      告警恢复通知是对告警策略维度的恢复通知,当告警策略的状态恢复为正常时,云监控判断为告警恢复。

    • 告警方式

      配置项

      说明

      告警渠道

      选择一个或多个渠道。支持邮箱电话短信以及告警回调
      其中,电话和短信通知的接收限制,请参见使用限制

      告警联系组

      告警渠道选择邮箱电话或者短信中的一个或多个渠道时,页面将展示告警联系组

      • 必须设置至少1个联系组作为告警通知的接收方。
      • 至多设置5个联系组作为告警通知的接收方。

      告警回调

      告警渠道选择告警回调时,页面将展示告警回调文本框。

      • 必须指定一个公网可用的URL。后续如果资源触发告警策略,则系统会把告警的详细信息通过POST请求发送至该URL,便于您进行深入的数据分析。
        • 支持选择已创建的回调地址,最多选择8个。
        • 支持填写回调地址,只能填写1个。
      • 建议您准备一台已开启HTTP服务且能在公网访问的服务器,然后将服务器的HTTP URL设置为告警回调URL。
      • 关于告警回调的更多信息,请参见告警回调使用说明
      • 告警回调支持关联飞书、钉钉、企业微信中的群机器人,以实现自动推送告警通知。具体操作,请参见通过飞书群接收告警通知通过钉钉群接收告警通知通过微信群接收告警通知