通过设置任务监控规则,可对任务运行进行监控。一个监控规则可被多个任务使用,一个任务也可使用多个监控规则。
您可以查看所选项目下全部已创建的监控规则,并对其进行管理。如有需要,可通过新建监控规则,增加新的监控。同时,在报警记录页面,可查看项目下全部以触发的报警。
配置管理监控规则
新建监控规则
配置监控规则的步骤如下:
登录DataLeap控制台。
选择数据开发 > 运维中心 > 离线任务运维 > 报警监控 > 监控规则,进入监控规则界面。

在监控规则界面,单击右上角新建监控规则按钮,进入监控规则配置界面,并完成以下规则参数配置。
新建监控规则参数的相关说明信息如下表所示:
基本信息:
参数 | 说明 |
|---|
监控类型 | 支持选择离线任务监控:适用于任务调度频率在 5 分钟以上的离线任务监控。 |
规则名称 | 输入规则名称,仅支持中英文字符、数字、下划线和中小括号。 |
规则对象 | 下拉搜索监控的任务对象,可设置多个,您可根据任务 ID 和任务名称进行搜索,选择后单击右侧添加按钮,完成对象添加。 |
规则描述 | 非必填,您可以添加当前规则的描述信息,或填写在收到报警后,相关的处理方式等。 注意 备注信息不支持填写“" ' { } \”字符,且备注长度不支持超过1000个字符,上述特殊字符可能导致发送消息失败。 |
监控内容:
参数 | 说明 |
|---|
报警 |
失败报警(单选) | - 第 N 次执行失败(N 由您指定),第 N 次执行失败后,开始报警,包含第N次、第N+1、第N+2......次执行失败报警。
- 每一次运行失败都报警。
- 重试结束后仍失败的情况发送报警。
|
超时报警(多选) | - 任务执行超时 N 分钟(N由您指定)。
- 在设定执行时间 N 分钟/小时后,任务未开始执行(以设定执行时间为基准,往后推算,到点未开始执行,则发送报警,直至任务开始执行)。
- 在设定执行时间 N 分钟/小时后,任务未结束执行(以设定执行时间为基准,往后推算,到点未开始执行,则发送报警,直至任务结束执行)。
- 在设定执行时间 N 分钟/小时后,任务未执行成功(以设定执行时间为基准,往后推算,到点检查任务状态,若不是 成功 状态,则发送报警,直至任务执行成功)。
- 截止北京时间 XX:XX,任务未执行成功( XX:XX 由您指定,到达您指定的时间,检查任务状态,若不是 成功 状态,则发送报警,直至任务执行成功。仅执行频率是天及以上调度频率的任务,可设置该监控)。
|
通知 |
执行状态 | 仅任务执行成功时,才会以邮件形式发送一次通知。 |
接受人
说明
通过飞书发送告警,需满足以下条件:
- 在DataLeap管理控制台的报警接收渠道配置中,已接入飞书相关平台,并已添加相应的飞书消息通知机器人信息,详见“报警接收渠道配置”。
- 目用户、任务责任人作为接收人时,若希望通过飞书发送告警方式,其账号信息需为飞书授权登录DataLeap控制台后自动创建,用户名为飞书邮箱前缀。
参数 | 说明 |
|---|
项目用户 | 项目下用户可作为消息接收人,用户账号信息中需登记手机、邮箱信息,您可输入账号前缀,对象支持设置多个。 说明 项目用户作为接收人,您需保证接收人在个人信息中的邮箱、手机号已填写完整。 |
飞书群 | 您可通过飞书开放平台,查询您所在的飞书用户群ID信息,消息机器人添加详见“报警接收渠道配置”。 |
任务责任人 | 勾选任务责任人,后续将告警信息发送至任务相关责任人。 |
报警设置
参数 | 说明 |
|---|
监控范围 | 按需选择任务实例的监控范围: - 全部实例:包含历史实例的监控,所有历史实例执行失败后,均会发出告警。
- 指定实例:以运行时间为基准,监控对应业务时间在最近 N 天的运行实例情况。
|
报警形式 | - 普通:当报警形式选择普通时,您可根据需要,设置报警发送次数和发送间隔,同时还能设置免打扰时段。
- 紧急:当报警形式选择紧急时,报警将无限次发送直至接收人手动确认,或手动ACK关闭报警。此时,您无法设置免打扰时段,只能设置每次报警的发送间隔。
|
发送方式 | 支持邮件、飞书、Webhook形式发送。 - 邮件:管理员手动创建的子用户作为项目用户或任务责任人来接收时,其用户信息中需添加对应的邮箱信息方可接收邮件告警。
- 飞书:通过飞书消息的方式,将告警通知到飞书授权的项目用户或任务责任人账号消息中,或直接发送到指定的飞书群中。
- Webhook:将消息发送到指定的webhook应用中。
说明 - 配置自定义 Webhook 地址时,上方接收人选项配置无效,即告警消息直接通过 Webhook 地址发送,并无具体的告警接收人概念。
- 勾选 Webhook 后,实例状态报警将主动推送至对应的 hookurl 中。
- hookurl 为 post 类型,且必须添加 http 或 https 协议头。
- Webhook 地址也可添加为飞书自定义机器人、钉钉自定义机器人和企业微信中的 Webhook 地址,创建机器人时,关键词必须包含 ”报警“ 两个字。
|
报警卡片 | 在相应的报警卡片信息中,选择是否需要@责任人。 |
语言 | 支持报警消息语言类型选择,若发送方式为飞书,则收到告警的语言类型需基于飞书客户端设置中的语言类型选择。 |
发送次数 | 普通的报警形式,您可自定义报警发送次数。 |
发送间隔 | 每次报警消息发送的时间间隔,以min为时间单位。 |
免打扰时段 | - 开启:普通报警形式,您可自定义免打扰时间段,在这段时间内,您不会收到报警。
- 关闭:紧急报警形式时,无法设置免打扰时段。
|
说明
创建规则时,可直接设置监控对象;在任务的不同阶段,也可为其设置相应的监控规则。
监控规则信息设置完成后,单击提交按钮,完成规则创建
管理监控规则
监控规则创建完后,您可在界面进行以下操作:
- 搜索监控规则
设置搜索信息,查询符合条件的任务列表。
若单击重置按钮,可以恢复项目下的默认展示。
当设置多个搜索条件时,会取各个条件的交集,进行查询。 - 批量操作
勾选一个或多个规则,单击相应按钮,对规则进行开启/关闭、删除、接收人替换、接收人重置等批量操作。 - 单规则操作
单击列表中某个规则操作列的相应按钮,可以编辑、开启/关闭、删除该规则,以及查看该规则的操作记录。
其余添加监控规则方式
在任务开发的不同阶段,可按需对该任务进行监控规则设置,具体操作入口如下:
- 开发页面:单击某个已上线的任务,进入配置页面,选择页面右上角的任务监控 > 运行监控,进入该任务的运行监控设置页面,进行监控规则设置。
- 提交上线页面:任务提交上线时,单击任务编辑栏左上角的提交上线图标按钮,在提交上线页面的监控设置部分,根据实际需要,给任务添加任务监控规则。
- 任务运维页面:通过单任务操作列的运行监控或批量任务的运行监控 > 添加监控规则,给指定任务进行监控规则设置。
- 监控规则页面:在监控规则列表中,单击某个规则操作列的编辑按钮,可以将指定的任务添加至规则对象。
项目默认监控规则
为快速配置任务运行保底监控,项目设置中推出默认监控设置。一旦启用,新任务上线时,将自动使用已设置的默认监控规则。相关设置说明可参见“新建项目”和“编辑项目配置”。
默认监控规则分为以下三类:
- 默认监控规则
- 由系统统一制定,不可修改。配置内容默认为重试结束仍失败,报警以邮件形式发送一次,接收人为任务负责人。
- 任务上线时/上线后,用户可选择是否使用默认监控规则。
- 离线自定义监控规则
自行创建的离线任务监控规则,可以在编辑项目时自行配置,支持同时选择多个监控。规则创建说明可参见“配置管理监控规则”。 - 流式自定义监控规则
自行创建的实时任务监控规则,可以在编辑项目时自行配置,支持同时选择多个监控。规则创建说明可参见“报警监控”。