You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
批运维
监控规则管理
复制全文
监控规则管理

通过设置任务监控规则,可对任务运行进行监控。一个监控规则可被多个任务使用,一个任务也可使用多个监控规则。
您可以查看所选项目下全部已创建的监控规则,并对其进行管理。如有需要,可通过新建监控规则,增加新的监控。同时,在报警记录页面,可查看项目下全部以触发的报警。

配置管理监控规则

新建监控规则

配置监控规则的步骤如下:

  1. 登录DataLeap控制台。

  2. 选择数据开发 > 运维中心 > 离线任务运维 > 报警监控 > 监控规则,进入监控规则界面。
    Image

  3. 在监控规则界面,单击右上角新建监控规则按钮,进入监控规则配置界面,并完成以下规则参数配置。
    新建监控规则参数的相关说明信息如下表所示:

    • 基本信息:

      参数

      说明

      监控类型

      支持选择离线任务监控:适用于任务调度频率在 5 分钟以上的离线任务监控。

      规则名称

      输入规则名称,仅支持中英文字符、数字、下划线和中小括号。

      规则对象

      下拉搜索监控的任务对象,可设置多个,您可根据任务 ID 和任务名称进行搜索,选择后单击右侧添加按钮,完成对象添加。

      规则描述

      非必填,您可以添加当前规则的描述信息,或填写在收到报警后,相关的处理方式等。

      注意

      备注信息不支持填写“" ' { } \”字符,且备注长度不支持超过1000个字符,上述特殊字符可能导致发送消息失败。

    • 监控内容:

      参数

      说明

      报警

      失败报警(单选)

      • 第 N 次执行失败(N 由您指定),第 N 次执行失败后,开始报警,包含第N次、第N+1、第N+2......次执行失败报警。
      • 每一次运行失败都报警。
      • 重试结束后仍失败的情况发送报警。

      超时报警(多选)

      • 任务执行超时 N 分钟(N由您指定)。
      • 在设定执行时间 N 分钟/小时后,任务未开始执行(以设定执行时间为基准,往后推算,到点未开始执行,则发送报警,直至任务开始执行)。
      • 在设定执行时间 N 分钟/小时后,任务未结束执行(以设定执行时间为基准,往后推算,到点未开始执行,则发送报警,直至任务结束执行)。
      • 在设定执行时间 N 分钟/小时后,任务未执行成功(以设定执行时间为基准,往后推算,到点检查任务状态,若不是 成功 状态,则发送报警,直至任务执行成功)。
      • 截止北京时间 XX:XX,任务未执行成功( XX:XX 由您指定,到达您指定的时间,检查任务状态,若不是 成功 状态,则发送报警,直至任务执行成功。仅执行频率是天及以上调度频率的任务,可设置该监控)。

      通知

      执行状态

      仅任务执行成功时,才会以邮件形式发送一次通知。

    • 接受人

      说明

      通过飞书发送告警,需满足以下条件:

      • 在DataLeap管理控制台的报警接收渠道配置中,已接入飞书相关平台,并已添加相应的飞书消息通知机器人信息,详见“报警接收渠道配置”。
      • 目用户、任务责任人作为接收人时,若希望通过飞书发送告警方式,其账号信息需为飞书授权登录DataLeap控制台后自动创建,用户名为飞书邮箱前缀。

      参数

      说明

      项目用户

      项目下用户可作为消息接收人,用户账号信息中需登记手机、邮箱信息,您可输入账号前缀,对象支持设置多个。

      说明

      项目用户作为接收人,您需保证接收人在个人信息中的邮箱、手机号已填写完整。

      飞书群

      您可通过飞书开放平台,查询您所在的飞书用户群ID信息,消息机器人添加详见“报警接收渠道配置”。

      任务责任人

      勾选任务责任人,后续将告警信息发送至任务相关责任人。

    • 报警设置

      参数

      说明

      监控范围

      按需选择任务实例的监控范围:

      • 全部实例:包含历史实例的监控,所有历史实例执行失败后,均会发出告警。
      • 指定实例:以运行时间为基准,监控对应业务时间在最近 N 天的运行实例情况。

      报警形式

      • 普通:当报警形式选择普通时,您可根据需要,设置报警发送次数和发送间隔,同时还能设置免打扰时段。
      • 紧急:当报警形式选择紧急时,报警将无限次发送直至接收人手动确认,或手动ACK关闭报警。此时,您无法设置免打扰时段,只能设置每次报警的发送间隔。

      发送方式

      支持邮件、飞书、Webhook形式发送。

      • 邮件:管理员手动创建的子用户作为项目用户或任务责任人来接收时,其用户信息中需添加对应的邮箱信息方可接收邮件告警。
      • 飞书:通过飞书消息的方式,将告警通知到飞书授权的项目用户或任务责任人账号消息中,或直接发送到指定的飞书群中。
      • Webhook:将消息发送到指定的webhook应用中。

      说明

      1. 配置自定义 Webhook 地址时,上方接收人选项配置无效,即告警消息直接通过 Webhook 地址发送,并无具体的告警接收人概念。
      2. 勾选 Webhook 后,实例状态报警将主动推送至对应的 hookurl 中。
      3. hookurl 为 post 类型,且必须添加 http 或 https 协议头。
      4. Webhook 地址也可添加为飞书自定义机器人、钉钉自定义机器人企业微信中的 Webhook 地址,创建机器人时,关键词必须包含 ”报警“ 两个字。

      报警卡片

      在相应的报警卡片信息中,选择是否需要@责任人。

      语言

      支持报警消息语言类型选择,若发送方式为飞书,则收到告警的语言类型需基于飞书客户端设置中的语言类型选择。

      发送次数

      普通的报警形式,您可自定义报警发送次数。

      发送间隔

      每次报警消息发送的时间间隔,以min为时间单位。

      免打扰时段

      • 开启:普通报警形式,您可自定义免打扰时间段,在这段时间内,您不会收到报警。
      • 关闭:紧急报警形式时,无法设置免打扰时段。

    说明

    创建规则时,可直接设置监控对象;在任务的不同阶段,也可为其设置相应的监控规则。

  4. 监控规则信息设置完成后,单击提交按钮,完成规则创建

管理监控规则

监控规则创建完后,您可在界面进行以下操作:

  1. 搜索监控规则
    设置搜索信息,查询符合条件的任务列表。
    若单击重置按钮,可以恢复项目下的默认展示。
    当设置多个搜索条件时,会取各个条件的交集,进行查询。
  2. 批量操作
    勾选一个或多个规则,单击相应按钮,对规则进行开启/关闭删除接收人替换接收人重置等批量操作。
  3. 单规则操作
    单击列表中某个规则操作列的相应按钮,可以编辑开启/关闭删除该规则,以及查看该规则的操作记录

其余添加监控规则方式

在任务开发的不同阶段,可按需对该任务进行监控规则设置,具体操作入口如下:

  • 开发页面:单击某个已上线的任务,进入配置页面,选择页面右上角的任务监控 > 运行监控,进入该任务的运行监控设置页面,进行监控规则设置。
  • 提交上线页面:任务提交上线时,单击任务编辑栏左上角的提交上线图标按钮,在提交上线页面的监控设置部分,根据实际需要,给任务添加任务监控规则。
  • 任务运维页面:通过单任务操作列的运行监控或批量任务的运行监控 > 添加监控规则,给指定任务进行监控规则设置。
  • 监控规则页面:在监控规则列表中,单击某个规则操作列的编辑按钮,可以将指定的任务添加至规则对象。

项目默认监控规则

为快速配置任务运行保底监控,项目设置中推出默认监控设置。一旦启用,新任务上线时,将自动使用已设置的默认监控规则。相关设置说明可参见“新建项目”和“编辑项目配置”。
默认监控规则分为以下三类:

  • 默认监控规则
    • 由系统统一制定,不可修改。配置内容默认为重试结束仍失败,报警以邮件形式发送一次,接收人为任务负责人。
    • 任务上线时/上线后,用户可选择是否使用默认监控规则。
  • 离线自定义监控规则
    自行创建的离线任务监控规则,可以在编辑项目时自行配置,支持同时选择多个监控。规则创建说明可参见“配置管理监控规则”。
  • 流式自定义监控规则
    自行创建的实时任务监控规则,可以在编辑项目时自行配置,支持同时选择多个监控。规则创建说明可参见“报警监控”。
最近更新时间:2026.02.04 10:41:49
这个页面对您有帮助吗?
有用
有用
无用
无用