流式数据监控依据监控规则,对消息队列 Kafka 版流式数据进行监控。本文将为您介绍如何设置并管理数据质量监控规则、报警提醒等。
登录DataLeap控制台。
选择数据质量 > 数据监控 > 流式数据监控 > 规则管理,进入流式监控页面。
在页面右上角的项目下拉列表中,选择要管理的项目。
单击新建规则按钮,进入新建规则页面。
说明
项目首次创建监控规则时,系统会检查该项目是否已完成初始化。
设置规则信息,单击确定按钮,完成规则创建。
注意
监控规则配置相关参数说明如下表所示。
参数 | 说明 |
|---|---|
初始化 | |
绑定引擎 | 支持 LAS。 |
关联实例 | 默认default,下拉可选。 |
关联Schema | 关联数据库的 Schema。下拉可选,可输入数据库名称关键词快速筛选。 |
保存至 | 监控规则的保存路径,下拉可选。 说明 在配置项目的数据开发 > 任务开发 > 资源库页面,至少已创建一个子目录,才能下拉选择。 |
选择Topic | |
类型 | 支持的 Topic 类型,支持选项 Kafka。 |
数据源 | Kafka 数据源,下拉可选已创建的数据源。 |
Topic名称 | Kafka 的 Topic名称,下拉可选已创建的Topic。 |
数据类型 | 支持Json。 |
监控数据源配置 | |
TaskManager个数 | Flink 作业中 TaskManager 的数量,自动填充默认值,可编辑。 |
开启跨VPC访问能力 | 默认开启,不可编辑。 |
私有VPCID | 数据源关联的消息队列 Kafka 版实例的私有网络ID。 |
子网ID | 数据源关联的消息队列 Kafka 版实例的子网 ID。 |
安全组ID | 数据源关联的消息队列 Kafka 版实例的私有网络安全组 ID。 |
单TaskManager内存大小(MB) | 单个 TaskManager 所占用的内存大小。 |
单TaskManager CPU数 | 单个 TaskManager 所占用的CPU数量。 |
单TaskManager slot数 | 单个 TaskManager 中slot的数量。 |
JobManager CPU数 | 单个 JobManager 所占用的CPU数量。 |
JobManager内存 | 单个 JobManager 所占用的内存大小。 |
监控规则配置 | |
规则名称 | 监控规则名称,可自行设置。 |
时间字段 | 根据Topic中该字段的取值,与该条数据进入Kafka的时间之间的差异来计算数据延迟。例如时间字段为A,数据进入Kafka的时间为T,则延迟为T-A。 说明 当选择时间字段延迟页签时,需设置该参数。 |
字段格式 | 根据对应格式解析时间字段,并计算延迟指标。 说明 当选择时间字段延迟页签时,需设置该参数。 |
监控字段 | Topic内需要监控的字段名称。 说明 当选择字段监控、空值监控页签时,需设置该参数。 |
字段类型 | 根据实际的监控字段类型选择。 说明 当选择字段监控、空值监控页签时,需设置该参数。 |
自定义逻辑 | Kafka数据已自动映射至manta_source表,需通过select ***** from manta_source编写自定义SQL。 说明 当选择自定义指标页签时,需设置该参数。 |
SQL中用的Json字段 | 设置SQL中用的Json字段的字段名称和字段类型。
说明 当选择自定义指标页签时,需设置该参数。 |
监控指标 | SQL产出的监控指标名称。 说明 当选择自定义指标页签时,需设置该参数。 |
开启数据Filter | 可选择是否开启数据Filter。 说明 当选择 Schema校验页签时,可设置该参数。 |
数据校验Schema | 根据该schema校验数据是否符合要求。如果某条数据不满足该schema,会被记为一条错误记录。 说明 当选择 Schema校验页签时,可设置该参数。 |
报警粒度 | 可选择按整体或字段进行监控报警。 说明 当选择 Schema校验页签时,可设置该参数。 |
时间窗口 | 提供 1分钟、3分钟、5分钟、10分钟、30分钟 五个选项,下拉可选。 |
报警条件 | 是指规则发出报警时,指标需要满足的条件。当监控指标被计算出来后,如果满足报警条件,就会发出报警。
|
*报警渠道 | 支持邮箱+站内信、短信、电话、Webhook 和飞书的告警方式,支持多选。 说明
|
*hookUrl | Webhook 请求地址,以 http 或 https 开头。 说明
|
*报警对象 | 接收报警的用户、飞书群或值班计划接收人。
|
*报警形式 | 支持普通和紧急两种形式。 说明 当报警渠道选择飞书时,才需设置该参数。 |
*报警发送 | 报警发送的次数。
说明
|
*发送间隔 | 报警发送的间隔时间,默认5分钟,可编辑。 |
*报警免打扰 | 可选择是否开启报警免打扰。 |
数据过滤 | 可选择是否开启过滤。 说明 当选择时间字段延迟、字段监控或控制监控页签时,可设置该参数。 |
对监控规则的管理,主要分为抽样数据源运维和监控规则运维两大类,相关操作步骤如下:
说明
暂停的规则将不再监控报警。