You need to enable JavaScript to run this app.
导航
监控管理
最近更新时间:2025.06.17 17:15:29首次发布时间:2024.04.30 15:17:21
我的收藏
有用
有用
无用
无用

在火山引擎增长分析平台的看板中,您可以通过创建监控任务实现数据动态监控,根据监控规则自动判断指标是否在正常范围内波动,出现异常时触发告警(邮件、群消息),无需人工每日跟踪判断,实现自动化监测,帮助您实时关注重点数据的多种数据维度波动变化。

注意事项:支持监控的图表要求

图表要求

详细说明

分析工具限制

使用分析工具进行分析时,可将分析图表保存至看板,保存后即可使用监控任务来监控对应看板的数据。当前支持的分析工具如下:

  • 事件分析图表
  • 转化分析图表
  • 留存分析图表

Image

分析数据的时间范围要求

监控图表数据时,当前支持对基于时间动态变化的数据进行监控,即:

  • 天级:天级的时间单位下:
    • 图表的分析时间为今天过去7天过去5天等动态范围时,支持对图表进行监控。
    • 图表的分析时间为固定的2023.12.01~2023.12.07,则不支持对图表进行监控。

      说明

      此场景下,图表的分析时间为固定时间,图表数据固定不变,业务层面也无需进行数据监控。

  • 小时级&5分钟级:小时和5分钟级的时间单位下,图表的时间范围需包含今天,才支持对图表进行数据监控。
    Image

    注意

    当前仅SaaS-云原生的云托管场景支持5分钟级的监控能力,且功能默认关闭置灰,如果您需要使用,可联系火山引擎技术支持人员进行评估后开通。如果您使用的是其他环境暂不支持5分钟级的监控能力。

前提条件
  • 已将待监控的图表保存为看板图表。
  • 已具备监控相关的操作权限,即被添加为集团成员或管理员,不同角色对监控的操作权限详情请参见下文的参考:监控操作权限细则

创建监控的入口

入口1:分析工具页面

入口2:看板页面

在支持的分析工具页面中,将分析图表保存到看板之后,可点击“监控数据”按钮添加监控任务。
Image

在看板页面中,符合监控条件的图表,点击图表右上角 > 添加监控任务,即可进入图表监控任务配置页面。
Image

配置监控任务

从监控任务配置入口进入任务配置页面后,您可根据界面提示配置任务名称、监控规则等任务信息。其中核心配置项介绍如下。

配置监控规则

配置监控规则即配置针对当前图表,需要监控的指标有哪些,以及后续触发监控告警消息的指标异常场景是什么。当前Finder为您提供了自定义规则智能监控两种监控方式。

自定义监控规则

Finder支持您根据业务需求灵活的配置图表监控规则,包括选择监控指标,设置监控的异常判定标准。详细配置参数说明如下。

参数

配置说明

监控方式

选择自定义规则

规则配置

Image

  • 选择需要监控的指标:您可以在下拉框中,从当前图表的所有指标中选择需要监控的指标。
  • 配置对应指标的异常判定标准:选定监控指标后,设置对应指标的异常场景,后续会依据此处配置的场景进行异常判定发送告警。天级图表和小时/5分钟级图表的的异常判定支持的过滤条件不一致。
    • 天级图表:支持对比前一日/固定值/上周同期等、上升/下降/波动超过、一定数值或一定比例。
    • 小时级图表:支持对比前一日同期/前一日累计/上一个小时等、上升/下降/波动超过、一定比例。
  • 当前支持添加多个监控指标/指标组的监控规则,并支持设置多个监控指标的告警触发规则的逻辑关系为“AND”或“OR”。
    • 当您希望对同样的监控指标/指标组进行监控,且针对这个监控指标/指标组有多个监控规则时,建议您在同一个监控指标下直接添加多个监控规则,并设置多个监控规则的逻辑关系为“AND”或“OR”。
    • 当您希望对不同的监控监控指标/指标组进行监控时,建议您添加多个监控指标,并分别配置各个监控指标的监控规则(同样支持设置多个规则,各规则间的逻辑关系为“AND”或“OR”),并设置多个监控指标/指标组的逻辑关系为“AND”或“OR”。

详细支持情况以控制台界面为准,各个典型场景下的监控规则生效逻辑请参见参考:监控规则生效逻辑

智能监控

Finder为您提供了智能监控能力,Finder系统可依据历史数据规律自动判定实际数据是否异常,如果实际数据值判定为异常,则按照后续配置的触达规则,自动发送告警消息。

注意

当前仅事件分析工具类的图表支持智能监控。

  • 小时级:置信区间95%,回溯天数7天。即参考的历史数据为近7天内的历史数据,判定为异常的数据为数据取值不在历史数据95%置信区间内的数据。
  • 天级:置信区间95%,回溯天数60天。即参考的历史数据为近60天内的历史数据,判定为异常的数据为数据取值不在历史数据95%置信区间内的数据。

配置监控触达

参数

配置说明-小时级图表

配置说明-天级图表

监控频率

每小时

每天

监控时段

支持灵活选择需要监控数据的时间范围。时间粒度可到小时粒度。
Image
如果您所在的时区有特殊要求,也支持配置不同的时区。

支持灵活选择需要监控数据的时间范围。时间粒度可到天粒度。
Image
如果您所在的时区有特殊要求,也支持配置不同的时区。

高级频控/触发时间

对于小时级的图表,为防止突发异常情况导致频繁告警,您可以针对告警消息的发送频次进行限制设置。
Image

说明

对于小时级的图表,图表数据生成周期短,在数据产出后由系统自动触发监控,无需您手动配置。

对于天级的图表,您需要配置开始监控的时间。

注意

您需关注,监控触发时间需在待监控指标数据已正常产出之后。例如,您的监控场景为监控指标A今天是否比昨天上升了20%。指标A今天的数据大约会在今天凌晨3点生成,此时您的监控触发时间就需要配置为凌晨3点之后。如果配置为凌晨3点之前,今天指标A的数据还未生成,则监控任务无法正常生效。

当前支持配置为默认自定义两种方式。
Image

  • 默认:数据构建完成后,自动触发监控,根据监控规则判断数据是否异常。此场景下监控触发时间一定在数据生成时间之后。
  • 自定义:灵活选择触发监控的时间点,仅在所选时间内“完成数据计算完成并触发告警条件”,推送告警。

通知方式

当前支持邮箱和企业群两种方式。

  • 邮箱:支持向固定邮箱中发送告警消息。您可以直接填写需要发送告警消息的邮箱地址,或在下拉框中选择已被添加为集团用户的用户邮箱,集团用户添加的操作指导请参见用户管理
  • 企业群:支持通过webhook向飞书、企业微信、钉钉、Slack的企业群组中发送告警消息。您可以在Webhook管理中添加webhook,后续即可在下拉框中选择对应的企业群组。

发送测试

单击左下角的发送测试,即可向上述配置的通知方式中发送测试邮件。

监控任务管理

入口位置:应用管理 > 监控管理,如下图:
Image

  • 顶部可通过我管理的、我接收的、不限关系来进行过滤筛选。
    • 我管理的:我创建的
    • 我接收的:通过邮箱判断
    • 不限关系:包括我创建的+我接收的(通过邮箱判断)
  • 可查监控列表并进行编辑、查看告警记录、关闭、删除等操作。

监控操作权限细则

说明

  • 归属不限:代表同时包含集团内其他人创建的监控任务。
  • 归属自己:代表为自己创建的监控任务。
  • 归属接收:代表推送邮箱里包含自己邮箱的监控任务,包括自己创建的和其他人创建的监控任务。

操作

归属

集团管理员(集团内)

管理员(有权限应用内)

成员

查看列表、
查看告警记录

不限

×

自己

接收

创建

不限

编辑、
变更状态、
删除

不限

×

自己

接收

×

参考:监控规则生效逻辑

场景1:仅需要监控一个指标

  • 场景说明:
    当前仅需要监控某一个具体的指标,根据这个指标的变化趋势决定是否需要触发监控告警。

  • 监控规则配置建议:
    添加一个监控指标;可根据实际情况配置一条或多条监控规则,多个监控规则支持设置逻辑关系为“AND”或“OR”;

  • 监控规则生效逻辑:

    逻辑关系为“AND”

    逻辑关系“OR”

    Image
    当“应用启动(总次数(PV))”这个指标上升值大于100、且上升率超过10%,才会触发告警。

    Image
    当“应用启动(总次数(PV))”这个指标上升值大于100或上升率超过10%,都会触发告警。

场景2:需要监控多个指标

  • 场景说明:
    当前需要监控多个指标,分别根据各个指标的变化趋势决定是否需要触发监控告警。

  • 监控规则配置建议:
    添加多个监控指标;根据实际情况配置各个监控指标的监控规则,多个监控规则支持设置逻辑关系为“AND”或“OR”;同时再配置各个监控指标的逻辑关系为“AND”或“OR”。
    配置示例如下。

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    Image

    • 添加了两个监控指标:
      • 第一个监控指标:
        • 选择了“页面访问总次数(PV)”作为监控指标。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
      • 第二个监控指标:
        • 选择了“应用启动总次数(PV)”作为监控指标。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
    • 当前两个监控指标间的逻辑关系为“AND”。

    Image

    • 添加了两个监控指标:
      • 第一个监控指标:
        • 选择了“页面访问总次数(PV)”作为监控指标。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
      • 第二个监控指标:
        • 选择了“应用启动总次数(PV)”作为监控指标。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
    • 当前两个监控指标间的逻辑关系为“OR”。
  • 监控规则生效逻辑:

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    Image

    • 当第一个监控指标第二个监控指标同时满足监控告警触发条件(监控规则)时,才会触发告警。
    • 各个监控指标满足监控告警触发条件(监控规则)的判断逻辑与上文“场景1”的示例一致,以第一个监控指标A1为例,当“页面访问总次数(PV)”取值比前一日上升超过100或上升率超过10%即满足触发监控告警条件。

    Image

    • 当第一个监控指标第二个监控指标同时满足监控告警触发条件(监控规则)时,才会触发告警。
    • 各个监控指标满足监控告警触发条件(监控规则)的判断逻辑与上文“场景1”的示例一致,以第一个监控指标A1为例,当“页面访问总次数(PV)”取值比前一日上升超过100或上升率超过10%即满足触发监控告警条件。

    总结:

    • 当A1满足、B1也同时满足触发告警条件时,才会触发告警。
    • A1或B1是否满足触发告警条件,与上文“场景1”的示例一致。

    总结:

    • 当A1或B1指标,其中某一个指标满足触发告警条件时,即会触发告警。
    • A1或B1是否满足触发告警条件,与上文“场景1”的示例一致。

场景3:仅需要监控一个指标组,且指标组内的指标监控规则一致

  • 场景说明:
    当前仅需要监控某一个具体的指标组,指标组内有多个细分的指标项,根据这个指标组内固定的几个细分指标项的变化趋势决定是否需要触发监控告警。

  • 监控规则配置建议:
    添加一个监控指标,指标选择指标组内需要监控的细分指标项(支持多选);可根据实际情况配置一条或多条监控规则,多个监控规则支持设置逻辑关系为“AND”或“OR”;
    配置示例如下。

    单指标内逻辑关系为“AND”

    单指标内逻辑关系“OR”

    Image

    • 单个监控指标内选择了指标组中的两个细分指标项:“总任务数:Moonshot AI”、“总任务数:xxxdeepseek”。
    • 当前监控指标有两条监控规则,且规则间的逻辑关系为“AND”。

    Image

    • 单个监控指标内选择了指标组中的两个细分指标项:“总任务数:Moonshot AI”、“总任务数:xxxdeepseek”。
    • 当前监控指标有两条监控规则,且规则间的逻辑关系为“OR”。
  • 监控规则生效逻辑:

    单指标内逻辑关系为“AND”

    单指标内逻辑关系“OR”

    Image
    当“总任务数:Moonshot AI”取值比前一日上升超过100且上升率超过10%,或者,“总任务数:xxxdeepseek”取值比前一日上升超过100且上升率超过10%,均会触发监控告警。

    Image
    当“总任务数:Moonshot AI”取值比前一日上升超过100或者上升率超过10%,或者,“总任务数:xxxdeepseek”取值比前一日上升超过100或者上升率超过10%,即会触发监控告警。

    总结:单一指标内如果选择了指标组内的多个指标项,则其中一个细分指标项满足指标组规则即会触发监控告警。

场景4:仅需要监控一个指标组,但指标组内的指标监控规则不一致

  • 场景说明:
    当前仅需要监控某一个具体的指标组,指标组内有多个细分的指标项,需要根据这个指标组内不同的几个细分指标项的变化趋势决定是否需要触发监控告警。

  • 监控规则配置建议:
    添加多个监控指标,各监控指标选择指标组内需要监控的细分指标项(支持多选);每个监控指标均根据实际情况配置一条或多条监控规则,多个监控规则支持设置逻辑关系为“AND”或“OR”;
    配置示例。

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    Image

    • 添加了两个监控指标:
      • 第一个监控指标:
        • 选择了指标组中的两个细分指标项:“总任务数:Moonshot AI”、“总任务数:xxxdeepseek”。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
      • 第二个监控指标:
        • 选择了指标组中的两个细分指标项:“成功率:Moonshot AI”、“成功率:xxxdeepseek”。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
    • 当前两个监控指标间的逻辑关系为“AND”。

    Image

    • 添加了两个监控指标:
      • 第一个监控指标:
        • 选择了指标组中的两个细分指标项:“总任务数:Moonshot AI”、“总任务数:xxxdeepseek”。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
      • 第二个监控指标:
        • 选择了指标组中的两个细分指标项:“成功率:Moonshot AI”、“成功率:xxxdeepseek”。
        • 配置了两个监控规则,规则间逻辑关系为“OR”。
    • 当前两个监控指标间的逻辑关系为“OR”。
  • 监控规则生效逻辑:

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    单指标内逻辑关系为“OR”;多指标逻辑关系为“AND”

    Image

    • 当第一个监控指标和第二个监控指标同时满足监控告警触发条件(监控规则)时,才会触发告警。
    • 各个监控指标满足监控告警触发条件(监控规则)的判断逻辑与上文“场景3”的示例一致,以第一个监控指标为例,当“总任务数:Moonshot AI”取值比前一日上升超过100或上升率超过10%,或者,“总任务数:xxxdeepseek”取值比前一日上升超过100或上升率超过10%,即满足触发监控告警条件。

    Image

    • 当第一个监控指标或第二个监控指标满足监控告警触发条件(监控规则)时,即会触发告警。
    • 各个监控指标满足监控告警触发条件(监控规则)的判断逻辑与上文“场景3”的示例一致,以第一个监控指标为例,当“总任务数:Moonshot AI”取值比前一日上升超过100或上升率超过10%,或者,“总任务数:xxxdeepseek”取值比前一日上升超过100或上升率超过10%,即满足触发监控告警条件。

    总结:添加多个监控指标时,各个监控指标下有多个监控规则时,单个指标是否满足触发监控告警条件的逻辑与添加单个指标的场景一致。