最近更新时间:2023.07.12 20:47:48
首次发布时间:2021.11.30 13:31:46
针对事故复盘、总结等场景的使用需求,事故管理模块提供了事故的新建登记、编辑修改等功能,并支持不同筛选维度的精细化查看需求。
事故记录内容主要分为基本信息、通知范围、复盘信息、事故定级四个部分,可根据实际情况进行录入。
基本信息:事故信息的基本组成部分。
通知范围:事故复盘通报的用户范围。
复盘信息:对事故发生过程、原因以及改进计划进行记录,便于追踪、处理问题。
事故定级:对事故定级并划分责任方。
已购买分布式数据自治服务。详细操作说明请参见 DataLeap 服务信息。
若SLA延迟较严重,比如是数据等级为D1的申报任务的延迟,则需要登记事故。
登录 DataLeap 控制台。
选择数据治理 > 复盘管理 > 事故管理 > 事故列表,进入事故列表页面。
新建并复盘事故通报。
单击事故通报按钮,在新建事故通报页面,填写事故信息后,单击提交按钮,即可新建一条事故记录。
可单击事故列表操作列的复盘按钮,对事故继续进行复盘登记后,单击相应按钮完成以下操作。
单击保存按钮,保存配置的复盘信息。
单击完成复盘按钮,完成事故复盘。此时,该事故的复盘按钮变为编辑按钮。
新建事故通报相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
参数 | 说明 |
---|---|
基本信息 | |
*事故标题 | SLA延迟事故的标题,自行设定。 |
*发生时间 | 事故发生的时间,下拉可选。 |
结束时间 | 事故结束的时间,下拉可选。 说明
|
*发现渠道 | 发现该事故的渠道,支持监控报警、客服、产品运营、分析师、技术人员、外部用户、内部用户和其他八个选项,下拉可选。 |
创建人 | 登记该事故的人员,默认为当前新建事故的用户,不可编辑。 |
*跟进人 | 跟进事故处理的人员,输入用户账号关键词后下拉可选。 |
直接影响内容 | 直接影响的任务。
|
影响团队 | 事故影响到的团队,下拉可选已创建的数据团队,支持设置多个。 |
影响补充说明 | 影响内容的补充说明。 |
通知范围 | |
通报范围 | 事故通报的用户范围,输入用户账号关键词后下拉可选。 说明 设置该参数后,新建事故通报时,会给该用户发送事故通报通知;完成复盘时,会给该用户发送事故复盘通知。 |
复盘信息 | |
事故过程 | 事故发生的过程。可根据需要进行描述,示例如下:
|
事故原因 | 事故发生的原因。 |
改进计划 | 事故整改计划,可按需添加多条。
说明 若填写改进计划,则名称前带 * 的参数为必填项。 |
事故定级 | |
事故定级 | 依据事故造成的影响定级,支持L0~L4、Notice、未定级等选项,严重程度由高到低,下拉可选。
说明
|
责任划分 | 该事故的责任划分情况,可根据实际情况添加多条。
说明
|
对已创建的事故通报,还可进行以下管理操作:
设置搜索条件,查看符合条件的事故列表。当设置多个搜索条件时,会取各个条件的交集,进行查询。
单击事故列表中某条信息操作列的编辑按钮,在编辑页面,可以修改该条事故通报。
单击事故列表中某条信息操作列的分析按钮,在弹出的事故分析窗口中,可以分析事故原因。
参数 | 说明 |
---|---|
分析维度 | 事故分析的维度,支持直接原因、根因分析、预防检测、监控发现和响应止损 |
问题类别 | 问题的归类。不同维度下有多个不同的类别选项,下拉可选。 |
详细描述 | 对该问题的详细描述。 |
单击事故列表中某条信息操作列的删除按钮,二次确认后,可以删除该条事故通报。
说明
仅事故创建人可以删除自己创建的事故通报。
当事故通报设置改进计划后,可在改进管理页面对事故改进项进行统一管理。
登录 DataLeap 控制台。
选择数据治理 > 复盘管理 > 事故管理 > 改进管理,进入改进管理页面。
可执行以下管理操作:
设置搜索条件,查看符合条件的改进项列表。当设置多个搜索条件时,会取各个条件的交集进行查询。
单击某条信息操作列的编辑按钮,在弹出的窗口中,可以修改该信息。
单击某条信息操作列的删除按钮,二次确认后,可以删除该条信息。
说明
仅创建人可以删除自己创建的事故改进项。
单击某条信息操作列的完成按钮,在弹出的窗口中,确认信息无误后,将该改进项的改进状态更改为已完成。
说明
仅改进状态为进行中的改进项支持该操作。
登记事故后,您可进入事故大盘页面,查看具体的统计情况。相关说明请参见治理概览。