最近更新时间:2024.02.28 20:04:51
首次发布时间:2023.09.13 10:10:30
容器服务支持通过 P2P 镜像加速功能,利用节点的内网带宽资源,在节点之间分发镜像,减少对镜像仓库的压力,大幅提升镜像拉取速度,缩短应用部署时间。同时,支持对 P2P 镜像加速功能进行监控。本文为您介绍如何配置和查看 P2P 镜像加速的监控信息。
说明
P2P 镜像加速方案的详情,请参见 P2P 镜像加速方案。
当您将容器服务集群正确接入托管 Prometheus,并安装了对应的组件后,需要配置对应的采集规则,才能正确采集指标。
说明
您可以在容器服务控制台中,查看预置的监控大盘。包括:代理请求总次数、当前代理请求总次数、任务总个数、失败的任务总个数、分片的总个数等。
说明
您也可以在集群中自建 Grafana,并通过 Grafana 查看指标和创建大盘。详情请参见 在容器服务集群中部署 Grafana 并接入工作区。
P2P 镜像加速监控的指标清单如下表所示。
大盘分类 | 大盘名称 | PromQL 语句 |
---|---|---|
P2P 镜像加速监控 | 代理请求总次数 | sum(dragonfly_dfdaemon_proxy_request_running_total{cluster="$clusterId"})by(instance) |
代理通过 drgonfly 的请求次数 | dragonfly_dfdaemon_proxy_request_via_dragonfly_total{cluster="$clusterId"} | |
代理没有通过 dragonfly 的请求次数 | dragonfly_dfdaemon_proxy_request_not_via_dragonfly_total{cluster="$clusterId"} | |
当前代理请求总次数 | dragonfly_dfdaemon_proxy_request_running_total{cluster="$clusterId"} | |
所有代理请求的总字节数 | sum(dragonfly_dfdaemon_proxy_request_bytes_total{cluster="$clusterId"})by(instance) | |
任务的总个数 | sum(dragonfly_dfdaemon_peer_task_total{cluster="$clusterId"})by(instance) | |
失败任务的总个数 | sum(dragonfly_dfdaemon_peer_task_failed_total{cluster="$clusterId"})by(instance) | |
分片的总个数 | sum(dragonfly_dfdaemon_piece_task_total{cluster="$clusterId"})by(instance) | |
失败的分片总个数 | sum(dragonfly_dfdaemon_piece_task_failed_total{cluster="$clusterId"})by(instance) | |
文件类型任务总个数 | sum(dragonfly_dfdaemon_file_task_total{cluster="$clusterId"})by(instance) | |
流式类型任务总个数 | sum(dragonfly_dfdaemon_stream_task_total{cluster="$clusterId"})by(instance) | |
作为 Seed Peer 下载总次数 | sum(dragonfly_dfdaemon_seed_peer_download_total{cluster="$clusterId"})by(instance) | |
作为 Seed Peer 下载失败总次数 | sum(dragonfly_dfdaemon_seed_peer_download_failure_total{cluster="$clusterId"})by(instance) | |
预取任务总个数 | sum(dragonfly_dfdaemon_prefetch_task_total{cluster="$clusterId"})by(instance) | |
作为 Seed Peer 的并行下载个数 | sum(dragonfly_dfdaemon_seed_peer_concurrent_download_total{cluster="$clusterId"})by(instance) | |
命中缓存任务个数 | sum(dragonfly_dfdaemon_peer_task_cache_hit_total{cluster="$clusterId"})by(instance) |
说明
如果您需要在托管 Prometheus 中的 Explore 功能或告警中心使用上述 PromQL 语句查看具体的指标或配置告警,请修改或删除语句中关于集群、节点、容器组的变量。例如:将 cluster=~"$Cluster"
参数中的$Cluster
变量修改为具体的集群 ID ,或直接删除该参数。
您可以使用托管 Prometheus 的 Explore 功能来快速查询和展示指标数据。详情请参见 指标查询。
您可以在托管 Prometheus 的告警中心配置集群相关告警。详情请参见 创建告警规则。