You need to enable JavaScript to run this app.
导航

通过模板创建实例监控告警规则

最近更新时间2023.11.14 10:20:40

首次发布时间2023.10.26 19:31:44

微服务引擎和托管 Prometheus 服务天然集成,支持通过预设的监控告警模板或者手动配置的方式,在托管 Prometheus 服务为微服务引擎的实例设置监控告警规则,实现对实例异常状况的及时告警。

说明

本文介绍通过告警模板创建监控告警规则的方法,手动创建的方法参见托管 Prometheus 服务中 创建告警规则

背景信息

当前支持通过预设的监控告警模板或者手动配置的两种方式设置监控告警规则。

  • 告警模板:微服务引擎基于通用的监控告警场景沉淀而成的监控告警规则模板。模板将部分规则的 PromQL 语句转化为可视化操作页面,降低规则配置的门槛。

    • MSE Nacos 资源:用于监控 Nacos 实例资源使用状况的告警模板。预设 CPU 使用率内存使用率JVM 堆内存使用率公网带宽使用率监控规则。
    • MSE Nacos 运行状态:用于监控 Nacos 实例运行状态的告警模板。预设 服务提供者数环比下跌服务订阅者数环比下跌配置监听者数环比下跌 监控规则。
  • 手动创建:基于您的业务需求,通过 PromQL 语句 手动配置告警规则,实现更贴合您的业务场景的监控告警能力。操作详情参见 手动创建告警规则

前提条件

操作步骤

  1. 登录告警规则创建页面。

    1. 登录 微服务引擎控制台
    2. 在左侧的导航栏单击 注册中心
    3. 实例管理 页面,单击目标实例的名称。
    4. 在实例详情页面,单击 监控告警 > 管理告警规则 页签。
      alt
  2. 单击 创建,在弹出的下拉菜单中选择 基于模板创建
    alt

  3. 模板分类 中选择 MSE,并选择目标模板。
    alt

  4. 配置告警组基本信息。
    alt

    参数说明
    名称配置告警规则组的名称。
    描述配置告警规则组的描述信息。
    工作区在下拉菜单中选择监控数据保存的工作区。

    变量

    配置告警规则组的变量信息。

    说明

    • 变量用于对监控数据中的云产品资源对象进行更细粒度的筛选,例如:在 MSE Nacos 资源 模版中,您可以通过变量选择注册中心实例。
    • 不同告警模版中的预置变量可能不同,请根据实际告警的需要合理配置。
    通知策略在下拉菜单中选择告警通知策略。系统会使用通知策略中配置的告警等级和联系人组,将告警发送给指定的联系人。详情请参见 创建告警通知策略
    聚合策略在下拉菜单中选择告警聚合策略。详情请参见 创建告警聚合策略
  5. 配置告警规则和触发条件。

    • 启用/关闭规则。单击 启用/关闭规则 按钮,允许您启用或关闭该规则。

    • 配置触发策略。

      alt

      参数说明
      触发条件勾选 P0、P1 或 P2,表示设定不同的告警等级。取消勾选,则表示不设定该等级的告警。

      触发策略

      • 比较条件:PromQL 模版和阈值之间的比较条件。支持多个比较条件,包括: 大于大于等于小于小于等于等于不等于
      • 阈值:配置触发告警的指标阈值。
      • 条件持续时间:配置指标符合条件的持续时间,包括:
        • 立即触发:满足告警条件后,立即触发告警。
        • 1 分钟:满足告警条件,并持续 1 分钟后,再触发告警。
        • 2 分钟:满足告警条件,并持续 2 分钟后,再触发告警。
        • 5 分钟:满足告警条件,并持续 5 分钟后,再触发告警。
        • 10 分钟:满足告警条件,并持续 10 分钟后,再触发告警。
  6. 完成所有告警规则的配置后,单击 确定,完成配置。

相关文档

手动创建告警规则:基于您的业务需求,通过 PromQL 语句 手动配置告警规则,实现更贴合您的业务场景的监控告警能力。操作详情参见 手动创建告警规则

说明