You need to enable JavaScript to run this app.
导航

产品功能

最近更新时间2024.03.26 18:39:22

首次发布时间2022.10.28 16:27:08

托管 Prometheus 是托管在火山引擎云端的标准化 Prometheus 服务。您可以快速创建云端实例,并完成资源和服务的监控。本文介绍托管 Prometheus 的主要功能。

工作区管理

功能描述
工作区工作区(Workspace)是托管 Prometheus 中数据和采集规则的抽象整合,为用户提供标准的云端 Prometheus 能力。支持创建、更新、删除工作区。
认证方式工作区支持 2 种认证方式,包括:火山引擎 AK/SK 认证、Basic Auth 认证。
读写地址工作区提供独立的 Remote Write URL 内网地址和 Query URL 内网地址,用于对工作区进行数据读写操作。

Recording Rule

  • 允许创建 Recording Rule,实现数据的二次聚合。减少查询端的资源占用,并提高查询效率。
  • 支持通过 YAML 规则文件完成 Recording Rule 的配置。支持使用标准 PromQL 语句对数据进行筛选。
  • 支持查看、导出、编辑和删除 Recording Rule 文件。

资源消耗

允许查看当前火山引擎账号下所有标准版工作区的写入指标量,包括基础指标和其他&自定义指标,帮助用户了解系统中的指标数量分布,并合理调整指标采集规则。

说明

企业版工作区按照实例规格计费,因此无需查看资源消耗情况。详情请参见 计费概述

数据可视化

功能描述

指标查询

  • 支持 Explore 功能,允许通过标准 PromQL 语句查询采集到的指标信息。
  • 指标预览支持动态刷新,包括:手工刷新和定时刷新。
  • 支持配置查询指标。允许通过手工方式输入 PromQL 查询语句,也支持在指标列表中直接选择指标、标签和值,对数据进行筛选。
  • 支持历史查询功能。系统会自动记录使用过的查询语句,并提供历史查询列表。方便用户快速获取历史查询语句。
监控看板提供多种类型的预置看板,方便用户快速查看监控信息。

告警管理

功能描述

联系人

  • 支持配置告警联系人,允许联系人通过邮箱、通用 Webhook、飞书机器人、钉钉机器人、电话等方式接收告警信息。
  • 支持配置告警联系人组。允许将指定的联系人添加到联系人组。

告警规则

  • 支持配置告警规则,允许通过指定工作区和查询语句(PromQL),监控指定资源。
  • 支持配置告警触发策略,并基于不同的阈值和持续时间进行告警分级(P0、P1 和 P2)。
  • 支持在告警规则中关联告警通知策略和告警聚合策略。

告警规则模板

  • 系统预置了常见的云产品告警规则模板,方便用户快速创建告警规则。
  • 支持自定义告警规则模板,允许通过控制台或 YAML 文件创建模板。
告警通知策略支持配置告警通知策略。允许基于不同的告警级别(P0、P1 和 P2),分别配置告警的通知对象和通知方式(邮箱、标准 Webhook、飞书、钉钉或电话)。
通知消息模板支持配置飞书通知消息模板,基于 Markdown 语法 和 Go Template 语法自定义飞书渠道的消息通知样式。
告警聚合策略支持配置告警聚合策略,允许配置聚合周期和通知周期。减少告警风暴的产生。

查看告警

  • 支持查看当前系统中的告警列表。包括:告警的 ID、当前状态、告警等级、工作区、告警资源、发生时间和所属规则。
  • 支持查看告警详情。包括:当前告警信息、告警指标和告警状态流转。

产品接入

功能描述
云服务接入支持监控火山引擎云原生产品,实现对云原生产品指标、工作状态、资源用量的监控和告警。已接入的产品包括:容器服务(VKE)、云服务器(ECS)、微服务引擎(MSE)、API 网关(APIG)等。
自建 Kubernetes 集群接入提供原生 Prometheus 采集器和高可用采集器方案,方便用户自建 Kubernetes 集群接入。
自定义业务接入支持开源社区提供的各种 SDK,在应用开发时对业务的监控指标进行定义,然后通过托管 Prometheus 实现对应用或服务的监控。
Exporter 接入支持开源社区提供的各种 Exporter,实现对各种环境、中间件、自定义应用的监控。