You need to enable JavaScript to run this app.
导航
报警记录
最近更新时间:2025.07.04 16:58:48首次发布时间:2022.11.16 11:32:24
复制全文
我的收藏
有用
有用
无用
无用

您可以根据报警记录列表,查看报警监控下所有触发的报警信息。包括监控规则产生的规则报警、基线触发的预警和破线告警等。本文为您介绍如何查看报警记录详情。

1 使用限制

  • 当前仅失败的离线任务所发送的告警卡片支持日志诊断、失败任务重跑以及切换任务队列重跑操作,成功的离线任务和流式任务暂时不支持这些操作。
  • 仅由飞书应用机器人发送的飞书或飞书群告警卡片,才支持相关告警卡片操作,其余 Webhook、邮件等方式发送的卡片不支持操作。

2 使用前提

  • 根据实际业务场景已创建相应的报警监控规则。详见监控规则
  • 飞书报警卡片中的诊断功能,是 DataLeap 智能运维助手的增值服务,需单独进行购买开通。并会根据实际输入/输出 Token 数进行计费。详见智能助手计费。若还未开通智能运维助手服务,您可单击卡片中的立即开启,进行服务开通操作。详见智能运维助手

3 进入报警记录页面

  1. 登录 DataLeap租户控制台
  2. 在对应项目下点击 运维中心 > 离线任务运维 > 报警监控 > 报警记录 界面。
  3. 报警记录 界面,您可以根据 内容搜索、报警时间、报警内容、发送方式、业务日期、接收人 等信息,进行报警列表的筛选,查看对应内容是否有发送告警。
    Image

4 查看报警详情

您可以在报警列表中,查看到具体的报警详情:

  • 报警任务/基线:展现报警信息对应的任务或者基线名称,点击可跳转到具体的任务运维或基线管理查看对象详情。
  • 业务日期:任务执行的业务日期,点击可跳转到对应业务日期下的实例运维或基线实例信息。
  • 报警内容:展现报警信息的具体报警内容,看是触发了什么异常报警。
  • 对应规则/基线:触发这条报警信息,对应的监控规则或基线信息,点击可跳转查看对应规则信息。

Image

5 飞书告警卡片

告警监控通过飞书应用机器人发送告警卡片到飞书或飞书群时,可直接在卡片中查看更多信息,并进行日志诊断、失败任务重跑、切换任务队列重跑等操作。飞书应用机器人注册详见1.1 飞书应用机器人创建

注意

  • 当前仅失败的离线任务所发送的告警卡片支持日志诊断、失败任务重跑、切换任务队列重跑操作,成功的离线任务和流式任务暂不支持。
  • 飞书应用机器人发送的飞书或飞书群告警卡片,才支持以下卡片操作,其余 Webhook、邮件等方式发送的卡片,不支持以下操作。

功能

说明

诊断

智能运维诊断可以对运行失败的实例进行错误诊断,为您提供清晰的诊断结果,以及相应的诊断解决方案建议,极大程度地为您节省排查错误日志问题的时间,帮助您快速找到解决问题的方法。
DataLeap 智能运维诊断助手为增值服务,需单独进行购买开通。并会根据实际输入/输出 Token 数进行计费。详见智能助手计费
若还未开通智能运维助手服务,您可单击告警卡片中的立即开启,进行服务开通操作,并在项目控制台 > 智能助手控制界面,启用智能运维助手。详见智能运维助手

注意

  • 目前,告警卡片中的诊断操作不受项目控制台 > 智能助手控制界面中的任务类型、优先级、诊断时间等因素控制,即在已启用智能运维助手的项目里,所有任务失败发出的告警,均能在告警卡片中发起诊断操作。
  • 卡片中诊断内容展现有限,更多诊断结果、诊断建议、错误原因等内容,您可进入离线任务实例运维界面,在实例日志的运行诊断窗口中进行查看。

屏蔽告警

若监控规则的告警发送次数设置多次时,可根据实际情况,将当前告警消息屏蔽一定的时间,避免重复发送。

仅重跑

单击告警卡片中的仅重跑按钮,可对当前失败任务进行重跑操作。

切换队列并重跑

单击告警卡片中的切换队列并重跑按钮,能够将当前失败任务切换至项目中绑定的其他执行队列或计算组,并单击提交按钮,即可进行重跑操作。

说明

  • Shell、Python、Notebook、离线数据集成任务,无需切换队列,因此该任务类型告警卡片中不支持切换队列并重跑按钮操作。
  • 在告警卡片内切换队列后,后续任务新生成的调度实例也将使用此队列进行调度,请确保此队列可用于日常调度实例的运行。

更多

单击告警卡片中的更多按钮,可跳转至任务运维界面,进行任务报警 ACK 设置,可按需给任务的指定监控内容,进行报警屏蔽设置。即在报警屏蔽时段,该任务触发指定监控的报警,系统会自行屏蔽,不发送给报警接收人。