报警归因模块整合统计了 DataLeap 平台中各模块报警监控业务产出的报警数据,并提供综合、全面、有效的报警治理解决方案和报警原因的分析。
报警归因的流程图大致如下:
收到平台报警后,您可前往报警归因 > 报警明细查看报警明细,并及时登记根因,根因负责人收到通知后,确认根因及相应报警的处理方式。
前往明细查找报警:
登录 DataLeap 控制台 。
在概览界面中,单击数据治理 > 报警归因 > 报警明细界面,便可查看具体的报警明细信息。
在报警明细中,你可以通过系统提供的各种维度,快速查找出您所接收到的所有报警明细记录。您可以通过以下方式进行查找:
在筛选后的明细列表中,您可进行以下操作:
操作项 | 说明 |
---|---|
报警 ID | 单击明细列表中的报警ID 信息,查看对应报警详情。 |
规则名称 | 单击明细列表中的规则名称,您可进入产生报警的监控规则详情页,查看设置的监控规则信息。 说明 系统创建的默认规则,不支持查看监控规则详情信息。 |
报警对象 | 单击明细列表中的报警对象,您可查看具体规则对象类型的详细信息,例如查看表详情或任务详情等。 |
监控详情 | 单击明细操作列中的监控详情,可进入数据质量监控结果页或运维中心实例运维界面,查看具体的监控结果。 |
去登记 | 单击明细操作列中的去登记按钮,进入登记界面,对该次报警的原因进行登记,操作详见下方问题登记操作说明。 |
问题登记操作说明:
其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
配置项 | 说明 |
---|---|
*发生日期 | 默认选择首次发生报警的时间,您可下拉选择其余的时间信息。 |
*描述 | 输入产生报警的问题描述信息及根因详情,方便后续接口人可根据描述定位根因和处理,也可以对该次报警的背景进行简单描述,便于后续分析以及记录本次报警影响的范围。 |
*根因 | 下拉选择问题根因场景,可选择离线场景和实时场景下,不同的问题根因类型。支持选择多个根因。 |
*解决方案 | 描述该报警问题的解决方案及相应的改进措施,若已经沉淀相应的解决方案文档,您也可将文档填入此处。 |
*直接影响内容 | 添加该报警直接影响的内容,默认关联当前登记的报警项。
|
影响补充说明 | 补充输入影响内容的说明,可记录问题的严重性或影响范围信息。 |
责任归属 | 选择该问题的责任是由团队内部还是团队外部造成的,选择项包括:团队内部、团队外部。 |
责任人 | 下拉选择具体的报警负责人信息,支持多选。 |
标签 | 下拉列表中选择该问题属于哪个标签,若还没有问题标签列表,您可直接通过输入的方式,来创建新的标签。 |
对于归属于同一个问题的报警,您可以在勾选多个报警项后,单击下方批量登记根因按钮,将多个报警项批量登记成一条问题记录。
登记问题完成后,您可进入治理全景 > 问题大盘页面,查看具体的登记问题统计情况。详见问题大盘。