You need to enable JavaScript to run this app.
导航
云监控接入
最近更新时间:2025.01.21 14:27:15首次发布时间:2023.09.27 10:43:53

托管 Prometheus 支持接入云监控,满足用户对云上基础资源、云产品、自定义业务的统一监控需求。本文为您介绍如何在托管 Prometheus 上接入云监控。

说明

【邀测·申请试用】:该功能依赖云监控产品开白能力,如需使用,请联系您的客户经理,协助您开通云监控 Exporter 功能。

背景信息

云监控是火山引擎云上一站式监控告警解决方案。可以帮助您收集并可视化展示火山引擎上多种类型云产品的资源状态和监控信息,包括:云服务器、集群、网关、专线连接、云存储等。详情请参见 什么是云监控

您可以通过在托管 Prometheus 上接入云监控的方式,将云监控上的云产品监控数据实时导出到托管 Prometheus,与您集群中的业务监控数据进行汇聚,实现业务数据和基础资源数据的统一监控。同时,还可以借助托管 Prometheus 与 Grafana 的天然兼容性,使用 Grafana 搭建业务相关的大盘。
Image

注意

目前仅支持导出部分云产品的监控数据,详情请参见 云监控文档

云监控产品导出的数据中,指标名称由NamespaceSubNamespaceMetricName组成,其中:

  • Namespace表示云产品。各云产品的Namespace请参见 云产品监控指标
  • SubNamespace表示云产品下的指标细分分类。
  • MetricName表示指标名。

说明

例如,当您导出云服务器(ECS)指标时,NamespaceVCM_ECSSubNamespaceGPUMetricNameGpuTemperature导出的指标名为GpuTemperature_GPU_VCM_ECS

前提条件

  • 已开通云监控和云监控的按量计费方式,详情请参见 产品计费
  • 相关云产品已接入云监控。
  • 已创建托管 Prometheus 工作区,详情请参见 创建工作区

操作步骤

配置集成任务

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 集成中心,并选择 产品服务 页签。
  4. 云监控 选项卡中,单击 创建集成任务
    Image
  5. 服务授权检查。系统会检查云监控服务相关权限是否已经授权。如未授权或开通,请根据页面指引,完成服务授权或功能开通。
    Image
  6. 单击 创建集成任务,并选择 开始接入 页签,配置集成任务的详情。
    alt
    配置项说明
    基础信息

    任务名称

    配置集成任务的名称。

    • 支持中文、英文大小写、数字和下划线_
    • 取值范围为 1~40 个字符。
    工作区选择已创建的托管 Prometheus 工作区。

    JobName

    配置云监控采集任务的名称。该名称用于区分不同的采集任务。
    接入后,您可以在 资源消耗 中使用该名称查看采集到的指标数量。

    云产品选择

    地域

    选择需要通过云监控采集指标云产品所在的地域。
    对于部分无地域属性的云产品(例如:云企业网),请选择 无地域展示

    云产品选择选择需要从云监控拉取指标的云产品。
    采集设置
    采集间隔配置指标采集间隔。支持选择 30s、1m、2m 和 5m。

    元信息 Label 导出方式

    配置云产品元信息导出方式。元信息主要包含云产品实例的 ProjectName、Name 等 Label。

    • 追加到原始指标:元信息将会追加到原始指标中,作为原始指标的 Label。支持使用原始指标进行查询。
    • 添加为独立指标:元信息将作为独立指标。支持使用volc_resource_info指标进行查询。

    说明

    仅部分云产品支持导出元信息,且不同云产品支持导出的元信息字段不同,详情请参见 云监控文档

    高级设置
    实例导出 Tag单击 添加标签,配置从云监控拉取产品指标时,需要导出的火山引擎资源标签。详情请参见 标签概述
    Metric Relabel 配置配置指标 Relabel,支持在指标采集的过程中,新增或替换指标中的 Label。配置方法,请参见 指标 Relabel

获取监控大盘

选择 效果预览 页签,支持查看云产品监控大盘示例。在 云产品选择 下拉菜单中选择您需要监控的云产品,单击 获取 Grafana 模版,即可下载 JSON 格式的 Grafana 监控大盘模版。
alt

查询监控指标

  1. 选择 采集指标 页签。
  2. 云产品选择 下拉菜单中选择您需要监控的云产品,并在 SubNamespace 下拉菜单中选择该云产品的指标分类。即可查看该分类下的指标详情。

alt

说明

更多云产品指标,请参见 云监控指标查询

结果验证

配置完成后,您可以查看集成任务的状态和详情。确定云监控是否正确接入 Promethues。

  1. 单击左侧导航栏的 集成中心,并选择 集成任务 页签。
  2. 在任务列表中,选择目标任务,在 操作 栏中单击 详情,即可查看集成任务的任务详情和监控看板。
    • 选择 任务信息,支持查看任务详情。
      Image
    • 选择 看板大盘,支持查看集成任务的监控大盘。包括:云产品实例数量、云产品指标数量、上一轮采集总耗时等。
      alt

监控信息

查询云产品指标

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 Explore,进入 Explore 页面。
  4. 在右上角的配置项中,配置需要查询指标的 工作区,并在 指标检索 文本框内,使用云监控的指标(例如CPUUser_Instance_VCM_ECS)查询,确认是否能够正确查询到对应的指标。
    Image

    说明

    • 云监控导出指标的名称格式为MetricName_SubNamespace_Namespace,例如CPUUser_Instance_VCM_ECS。不同云服务产品的指标详情,请参见 云产品监控指标
    • 您可以使用ResourceID字段,对资源进行细粒度筛选,查看具体资源的监控信息。
    • 如果您需要使用 Grafana 构建监控大盘,可以将托管 Prometheus 的数据接入自建 Grafana。详情请参见 在容器服务集群中部署 Grafana 并接入工作区

查询云产品实例元信息

说明

仅部分云产品支持导出元信息,且不同云产品支持导出的元信息字段不同。详情请参考 云监控文档

  • 元信息 Label 导出方式 选择 追加到原始指标 时,可以直接在 Explorer 页面查看云产品的原始指标。查询结果中包含云产品的元信息 Label。例如在本例中,可以在 ECS 的原始指标CPUUser_Instance_VCM_ECS中查看到其元信息 Label(ProjectName、Name、Status、AvailableZone 等)。
    alt

  • 元信息 Label 导出方式 选择 添加为独立指标 时,可以通过volc_resource_info指标查看云产品实例的元信息。
    alt
    支持通过 join 计算查询具体云产品实例返回的元信息,模板如下:

    {云产品指标} * on(ResourceID) group_left({元信息标签}) avg(volc_resource_info) by (ResourceID,{元信息标签})
    

    查询示例如下:

    CPUUser_Instance_VCM_ECS * on(ResourceID) group_left(Name,ProjectName) avg(volc_resource_info) by (ResourceID,Name,ProjectName)
    

    预期结果如下,可以查看不同云产品实例返回的元信息详情。
    alt

  • 当使用 实例导出 Tag 功能,导出云产品实例的资源标后,系统会自动在标签前增加tag_前缀。例如资源标签为ecs-label,则导出后的指标标签为tag_ecs_label
    alt

搭建云产品监控大盘

您可以在容器服务集群或 ECS 主机中自建 Grafana,并导入在配置集成任务时获取的监控大盘模板,然后通过 Grafana 查看指标和创建大盘。

配置云产品告警

您可以在托管 Prometheus 的告警中心配置相关告警。详情请参见 创建告警规则