托管 Prometheus 支持接入云监控,满足用户对云上基础资源、云产品、自定义业务的统一监控需求。本文为您介绍如何在托管 Prometheus 上接入云监控。
说明
【邀测·申请试用】:该功能依赖云监控产品开白能力,如需使用,请联系您的客户经理,协助您开通云监控 Exporter 功能。
云监控是火山引擎云上一站式监控告警解决方案。可以帮助您收集并可视化展示火山引擎上多种类型云产品的资源状态和监控信息,包括:云服务器、集群、网关、专线连接、云存储等。详情请参见 什么是云监控。
您可以通过在托管 Prometheus 上接入云监控的方式,将云监控上的云产品监控数据实时导出到托管 Prometheus,与您集群中的业务监控数据进行汇聚,实现业务数据和基础资源数据的统一监控。同时,还可以借助托管 Prometheus 与 Grafana 的天然兼容性,使用 Grafana 搭建业务相关的大盘。
注意
目前仅支持导出部分云产品的监控数据,详情请参见 云监控文档。
云监控产品导出的数据中,指标名称由Namespace
、SubNamespace
、MetricName
组成,其中:
Namespace
表示云产品。各云产品的Namespace
请参见 云产品监控指标。SubNamespace
表示云产品下的指标细分分类。MetricName
表示指标名。说明
例如,当您导出云服务器(ECS)指标时,Namespace
为VCM_ECS
,SubNamespace
为GPU
,MetricName
为GpuTemperature
导出的指标名为GpuTemperature_GPU_VCM_ECS
。
配置项 | 说明 |
---|---|
基础信息 | |
任务名称 | 配置集成任务的名称。
|
工作区 | 选择已创建的托管 Prometheus 工作区。 |
JobName | 配置云监控采集任务的名称。该名称用于区分不同的采集任务。 |
云产品选择 | |
地域 | 选择需要通过云监控采集指标云产品所在的地域。 |
云产品选择 | 选择需要从云监控拉取指标的云产品。 |
采集设置 | |
采集间隔 | 配置指标采集间隔。支持选择 30s、1m、2m 和 5m。 |
元信息 Label 导出方式 | 配置云产品元信息导出方式。元信息主要包含云产品实例的 ProjectName、Name 等 Label。
说明 仅部分云产品支持导出元信息,且不同云产品支持导出的元信息字段不同,详情请参见 云监控文档。 |
高级设置 | |
实例导出 Tag | 单击 添加标签,配置从云监控拉取产品指标时,需要导出的火山引擎资源标签。详情请参见 标签概述。 |
Metric Relabel 配置 | 配置指标 Relabel,支持在指标采集的过程中,新增或替换指标中的 Label。配置方法,请参见 指标 Relabel。 |
选择 效果预览 页签,支持查看云产品监控大盘示例。在 云产品选择 下拉菜单中选择您需要监控的云产品,单击 获取 Grafana 模版,即可下载 JSON 格式的 Grafana 监控大盘模版。
说明
更多云产品指标,请参见 云监控指标查询。
配置完成后,您可以查看集成任务的状态和详情。确定云监控是否正确接入 Promethues。
CPUUser_Instance_VCM_ECS
)查询,确认是否能够正确查询到对应的指标。说明
MetricName_SubNamespace_Namespace
,例如CPUUser_Instance_VCM_ECS
。不同云服务产品的指标详情,请参见 云产品监控指标。ResourceID
字段,对资源进行细粒度筛选,查看具体资源的监控信息。说明
仅部分云产品支持导出元信息,且不同云产品支持导出的元信息字段不同。详情请参考 云监控文档。
当 元信息 Label 导出方式 选择 追加到原始指标 时,可以直接在 Explorer 页面查看云产品的原始指标。查询结果中包含云产品的元信息 Label。例如在本例中,可以在 ECS 的原始指标CPUUser_Instance_VCM_ECS
中查看到其元信息 Label(ProjectName、Name、Status、AvailableZone 等)。
当 元信息 Label 导出方式 选择 添加为独立指标 时,可以通过volc_resource_info
指标查看云产品实例的元信息。
支持通过 join 计算查询具体云产品实例返回的元信息,模板如下:
{云产品指标} * on(ResourceID) group_left({元信息标签}) avg(volc_resource_info) by (ResourceID,{元信息标签})
查询示例如下:
CPUUser_Instance_VCM_ECS * on(ResourceID) group_left(Name,ProjectName) avg(volc_resource_info) by (ResourceID,Name,ProjectName)
预期结果如下,可以查看不同云产品实例返回的元信息详情。
tag_
前缀。例如资源标签为ecs-label
,则导出后的指标标签为tag_ecs_label
。您可以在容器服务集群或 ECS 主机中自建 Grafana,并导入在配置集成任务时获取的监控大盘模板,然后通过 Grafana 查看指标和创建大盘。
您可以在托管 Prometheus 的告警中心配置相关告警。详情请参见 创建告警规则。