You need to enable JavaScript to run this app.
导航

P2P 镜像加速监控

最近更新时间2024.02.28 20:04:51

首次发布时间2023.09.13 10:10:30

容器服务支持通过 P2P 镜像加速功能,利用节点的内网带宽资源,在节点之间分发镜像,减少对镜像仓库的压力,大幅提升镜像拉取速度,缩短应用部署时间。同时,支持对 P2P 镜像加速功能进行监控。本文为您介绍如何配置和查看 P2P 镜像加速的监控信息。

说明

P2P 镜像加速方案的详情,请参见 P2P 镜像加速方案

前提条件

操作步骤

当您将容器服务集群正确接入托管 Prometheus,并安装了对应的组件后,需要配置对应的采集规则,才能正确采集指标。

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群
  3. 在集群列表页面,单击目标集群。
  4. 在集群管理页面的左侧导航栏中,选择 监控中心 > 监控看板
  5. 在配置页面右上角,单击 指标采集配置
  6. 选择 数据面组件 页签,在组件列表 是否采集 列,单击开关,开启 p2p-accelerator 组件的采集规则。
    alt
  7. (可选)单击组件列表 操作 栏中的 编辑指标,支持选择或丢弃组件的具体指标,并配置面向该组件的采集间隔。
    • 在 采集间隔 下拉菜单中,选择该组件指标的采集间隔。不同组件支持的采集间隔不同。
    • 在指标列表中,勾选指标,则采集该指标。取消勾选,则丢弃该指标。单击 指标类型 表头,允许基于指标类型对指标项进行筛选。
      alt

      说明

      • 减小指标采集间隔,会增加单位时间内上报的指标数量,可以提升监控精度。但会增加托管 Prometheus 标准版工作区的费用。增加指标采集间隔,会减少单位时间内上报的指标数量,可以减少托管 Prometheus 标准版工作区的费用,但会降低监控精度。请根据实际需要配置。
      • 云产品的指标类型分为 基础指标 和 其他指标,不同类型指标的计费方式不同,详情请参见 托管 Prometheus 计费方式

查看大盘

您可以在容器服务控制台中,查看预置的监控大盘。包括:代理请求总次数、当前代理请求总次数、任务总个数、失败的任务总个数、分片的总个数等。

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群
  3. 在集群列表页面,单击目标集群。
  4. 在集群管理页面的左侧导航栏中,选择 监控中心 > 监控看板
  5. 在左侧看板列表中选择 镜像加速服务监控 > p2p 镜像加速监控,即可查看监控大盘。
    alt

    说明

    您也可以在集群中自建 Grafana,并通过 Grafana 查看指标和创建大盘。详情请参见 在容器服务集群中部署 Grafana 并接入工作区

指标清单

P2P 镜像加速监控的指标清单如下表所示。

大盘分类大盘名称PromQL 语句
P2P 镜像加速监控代理请求总次数sum(dragonfly_dfdaemon_proxy_request_running_total{cluster="$clusterId"})by(instance)
代理通过 drgonfly 的请求次数dragonfly_dfdaemon_proxy_request_via_dragonfly_total{cluster="$clusterId"}
代理没有通过 dragonfly 的请求次数dragonfly_dfdaemon_proxy_request_not_via_dragonfly_total{cluster="$clusterId"}
当前代理请求总次数dragonfly_dfdaemon_proxy_request_running_total{cluster="$clusterId"}
所有代理请求的总字节数sum(dragonfly_dfdaemon_proxy_request_bytes_total{cluster="$clusterId"})by(instance)
任务的总个数sum(dragonfly_dfdaemon_peer_task_total{cluster="$clusterId"})by(instance)
失败任务的总个数sum(dragonfly_dfdaemon_peer_task_failed_total{cluster="$clusterId"})by(instance)
分片的总个数sum(dragonfly_dfdaemon_piece_task_total{cluster="$clusterId"})by(instance)
失败的分片总个数sum(dragonfly_dfdaemon_piece_task_failed_total{cluster="$clusterId"})by(instance)
文件类型任务总个数sum(dragonfly_dfdaemon_file_task_total{cluster="$clusterId"})by(instance)
流式类型任务总个数sum(dragonfly_dfdaemon_stream_task_total{cluster="$clusterId"})by(instance)
作为 Seed Peer 下载总次数sum(dragonfly_dfdaemon_seed_peer_download_total{cluster="$clusterId"})by(instance)
作为 Seed Peer 下载失败总次数sum(dragonfly_dfdaemon_seed_peer_download_failure_total{cluster="$clusterId"})by(instance)
预取任务总个数sum(dragonfly_dfdaemon_prefetch_task_total{cluster="$clusterId"})by(instance)
作为 Seed Peer 的并行下载个数sum(dragonfly_dfdaemon_seed_peer_concurrent_download_total{cluster="$clusterId"})by(instance)
命中缓存任务个数sum(dragonfly_dfdaemon_peer_task_cache_hit_total{cluster="$clusterId"})by(instance)

说明

如果您需要在托管 Prometheus 中的 Explore 功能或告警中心使用上述 PromQL 语句查看具体的指标或配置告警,请修改或删除语句中关于集群、节点、容器组的变量。例如:将 cluster=~"$Cluster"参数中的$Cluster变量修改为具体的集群 ID ,或直接删除该参数。

查看指标

您可以使用托管 Prometheus 的 Explore 功能来快速查询和展示指标数据。详情请参见 指标查询

配置告警

您可以在托管 Prometheus 的告警中心配置集群相关告警。详情请参见 创建告警规则