最近更新时间:2023.07.06 10:49:28
首次发布时间:2022.05.27 17:34:59
实时任务报警监控功能,支持您通过配置自定义报警规则,来实现对实时任务运行状态的监控。
本文将为您介绍实时任务报警监控规则配置的相关操作。
通过任务监控规则,可对流式任务运行进行监控,在监控规则页面,您可查看该项目下全部已创建的规则监控,并对其进行管理。您也可以通过新建监控规则按钮,增加新的监控规则。
说明
一个监控规则可被多个任务使用,一个任务可使用多个监控规则。
登录 DataLeap租户控制台 。
选择数据开发 > 运维中心 > 实时任务运维 > 报警监控 > 监控规则,进入监控规则页面。
右上角单击新建监控规则按钮,进入报警设置页面,可以对任务监控规则进行配置,配置信息包括:基本信息、监控内容、接收人和报警设置四部分:
参数 | 说明 |
---|---|
基本信息 | |
规则名称 | 输入实时任务监控规则的名称,支持中英文字符、数字、下划线和中小括号。 |
规则对象 | 根据任务ID和任务名称,进行搜索实时任务,可监控多个任务对象。 |
规则描述 | 可填写收到该报警后,应有的处理方式,方便定位管理,非必填。 |
监控内容 | |
数据源监控 |
|
运行监控 |
注意 其中 Flink Full-restart 次数、Checkpoint 失败次数监控,目前仅对 Serverless Flink、LAS 引擎提供的流式任务会生效。 |
接收人 | |
项目用户 | 可将任务责任人或指定项目成员,设置为报警/通知的接收人,支持配置多个接收人。 注意 项目用户作为接收人,您需保证接收人在火山控制台 > 访问控制中个人信息邮箱、手机号已填写完整。 |
报警设置 | |
发送方式 | 支持邮件、短信、Webhook、电话等发送方式。 注意
|
免打扰时段 | 选择是否开启免打扰时段,在免打扰时段内,不会收到任务告警。 |
搜索监控规则:
设置搜索信息,查询符合条件的任务列表。单击重置按钮,可以恢复项目下的默认展示。 当设置多个搜索条件时,会取各个条件的交集,进行查询。
管理已建规则:
批量操作:勾选一个或多个规则,单击相应按钮,对规则进行开启/关闭、删除、接收人替换、接收人重置等批量操作。
单规则操作:单击列表中某个规则操作列的相应按钮,可以编辑、开启/关闭、删除该规则,以及查看该规则的操作记录。
任务开发的不同阶段,可按需进行监控规则的设置,具体操作入口如下:
任务运维页面:通过单任务操作列的报警配置或批量操作栏的添加监控规则 ,给指定任务进行监控规则设置。
监控规则页面:在监控规则列表中,单击某个规则操作列的编辑按钮,可以将指定的任务添加至规则对象。
{ "taskType":630, // 任务类型 "taskOwner":"tianxxxxx", // 任务责任人 "alarmInstId":180879272, // 报警记录id "externalRuleId":502567967, //云监控规则id "alarmTime":"2023-04-13 20:57:56", // 报警时间 "taskPriority":1, // 任务优先级 "ruleName":"[voc]webhook回调测试", // 报警规则名称 "taskName":"google_play_source_save", // 报警任务名称 "ruleId":3791818, // 报警规则id "projectId":1030, // 任务项目id "taskId":102125772,// 任务id "alarmItemType":2 // 报警项类型 }
字段名 | 类型 | 说明 |
---|---|---|
taskType | Integer | 任务类型:
|
taskOwner | String | 任务责任人 |
alarmInstId | Long | 报警记录 ID |
externalRuleId | Long | 云监控规则 ID |
alarmTime | String | 报警时间 |
taskPriority | Integer | 任务优先级:
|
ruleName | String | 报警规则名称 |
taskName | String | 报警任务名称 |
ruleId | Long | 实时任务运维中心配置的报警规则 ID |
projectId | Long | 任务所属项目 ID |
taskId | Long | 任务 ID |
alarmItemType | Integer | 监控内容所属报警项类型 ID:
|
在报警记录页面,您可以根据报警记录列表,查看报警监控下所有触发的报警信息,包括监控规则产生的规则报警、基线触发的预警和破线告警等。您可以进行以下操作:
搜索报警记录:
设置搜索信息,查询符合条件的报警记录列表。当设置多个搜索条件时,会取各个条件的交集,进行查询。
单击报警列表中的报警任务、对应规则栏,您可以查看相应的任务信息和监控规则信息。
对于已触发的报警项,您可单击操作列的 ACK 按钮,以分钟或小时粒度,设置报警屏蔽时间,将对应的报警信息进行屏蔽。