You need to enable JavaScript to run this app.
导航

Watchdog自动异常检测

最近更新时间2022.11.11 18:44:54

首次发布时间2021.12.21 20:00:54

Watchdog模块自动检测可能的基础组件和服务异常,无需您干预即可检测出系统风险点,帮助您及时消除隐患,快速定位和排查线上问题。

您可以浏览Watchdog事件中心,筛选出潜在风险问题予以解决;也可以针对Watchog事件配置告警通知,收到告警通知后再处理。

前提条件

基础组件(主机、Docker、进程):无需额外接入

服务监控(服务、中间件):接入Trace功能

自动异常检测

自动异常检测展示生效的Watchdog监控类型、事件名称、规则内容。
当前所有的检测规则均为预设,无需您干预。

Watchdog检测范围包括但不限于:

  • 主机监控:负载、CPU、内存、磁盘

  • Docker监控:CPU、内存、磁盘IO

  • 进程监控:CPU、内存、磁盘IO、文件打开数、JVM

  • 服务监控:QPS、错误率、延时、错误日志数

  • 中间件监控:QPS、错误率、延时

事件中心

聚合视图

每一行代表一类watchdog事件,相同事件的多次触发将被聚合到一行,提高可读性。

左侧会展示相关事件的类型、事件名,以及该事件的发生时间段。右侧展示与该事件对应的检测指标的趋势图,趋势图中以红色圆圈标注出每个事件的发生时间点。

单击展开事件,则会展示单个事件的详情。例如下图事件的触发原因是平均延时上涨超过阈值。

平铺视图

取消勾选事件聚合展示,展示事件的平铺视图,每一行代表单个事件触发。

配置告警

为避免打扰,Watchdog检测出的事件默认只会展示在事件中心,不会给您发送提醒消息。您可以手动配置相关告警从而收到告警信息。

单击事件名称,在事件详情页,单击创建报警任务

填写报警任务名称、添加筛选和通知方式。

此时再换到事件详情页,即可看到与该事件相关的报警。此时Watchdog检测到相关事件后,则会给对应通知人发送报警消息。