You need to enable JavaScript to run this app.
导航

CNI 网络观测

最近更新时间2024.03.01 15:54:58

首次发布时间2024.03.01 15:54:58

CNI 网络 Kubernetes 集群最重要的底层资源和基础设施,其资源池最大容量、资源池当前资源总数等指标直接关系到集群的性能和稳定性。本文为您介绍如何配置 CNI 网络观测。

说明

邀测·申请试用】:该功能目前处于 邀测 阶段,如需使用,请提交申请。

前提条件

操作步骤

步骤一:开启观测

  1. 登录 容器服务控制台
  2. 在左侧导航栏单击 集群,找到目标集群,单击集群名称。
  3. 在集群管理页面的左侧导航栏中,单击 观测配置
  4. 选择 CNI 网络 卡片,单击 启用,开启集群 CNI 网络观测。
    alt
  5. 系统自动检查开启观测所需的必要条件。包括:工作区配置、组件状态等。
    alt
  6. 单击 开启,开启 CNI 网络观测。

步骤二:配置采集规则

监控开启后,您可以配置采集规则,选择需要采集的目标组件、具体指标项及采集间隔。可以根据实际需求丢弃一些不用的指标。

  1. 在集群管理页面的左侧导航栏中,单击 观测配置
  2. 选择 CNI 网络 卡片,单击 编辑配置 并选择 指标 页签,配置采集规则,并选择具体的采集指标。
    • 在组件列表 操作 列,单击开关,开启或关闭组件的采集规则。当关闭组件的采集规则时,系统不会采该集组件的所有指标。
      alt
    • 单击组件列表 操作 栏中的 alt,支持选择或丢弃组件的具体指标,并配置面向该组件的采集间隔。
      • 采集间隔 中,选择该组件指标的采集间隔。不同组件支持的采集间隔不同。
      • 指标列表 中,勾选指标,则采集该指标。取消勾选,则丢弃该指标。单击 全部基础指标其他指标 页签,允许基于指标类型对指标项进行筛选。
        alt

        说明

        • 减小指标采集间隔,会增加单位时间内上报的指标数量,可以提升监控精度。但会增加托管 Prometheus 标准版工作区的费用。增加指标采集间隔,会减少单位时间内上报的指标数量,可以减少托管 Prometheus 标准版工作区的费用,但会降低监控精度。请根据实际需要配置。
        • 云产品的指标类型分为 基础指标其他指标,不同类型指标的计费方式不同,详情请参见 托管 Prometheus 计费方式
  3. 单击 确认,完成配置。

步骤三:配置告警

您可以基于系统预置的告警模板,快速完成 CNI 网络观测的告警配置。

  1. 在集群管理页面的左侧导航栏中,单击 观测配置
  2. 选择 CNI 网络 卡片,单击 编辑配置 并选择 告警 页签,配置告警的相关参数。
    alt
    配置项说明
    告警模版勾选需要的告警模版,允许多选。
    告警聚合策略在下拉菜单中选择告警聚合策略。详情请参见 创建告警聚合策略
    告警通知策略在下拉菜单中选择告警通知策略。系统会使用通知策略中配置的告警等级和联系人组,将告警发送给指定的联系人。详情请参见 创建告警通知策略
  3. 单击 确定,完成配置。

观测看板

您可以查看 CNI 网络的监控信息,包括:IP 池最大容量、IP 池缓存目标值、IP 池缓存最小值等。支持设置查询的时间段,并指定刷新方式(手动刷新、自动刷新)。

  1. 在集群管理页面的左侧导航栏中,选择 监控中心 > 监控看板
  2. 在左侧看板列表中选择 网络服务监控 > vpc-cni 监控,即可查看监控大盘。

alt

该看板的指标清单如下表所示。

看板名称PromQL 语句
IP 池最大容量resource_pool_max_cap{cluster="$ClusterId", node="$Node"}
IP 池缓存目标值resource_pool_target{cluster=~"$ClusterId", node=~"$Node"}
IP 池缓存最小值resource_pool_target_min{cluster=~"$ClusterId", node=~"$Node"}
IP 池当前 IP 总数resource_pool_total{cluster=~"$ClusterId", node=~"$Node"}
IP 池当前可用 IP 数resource_pool_available{cluster="$ClusterId", node=~"$Node"}

说明

如果您需要在托管 Prometheus 中的 Explore 功能或告警中心使用上述 PromQL 语句查看具体的指标或配置告警,请修改或删除语句中关于集群、节点、容器组的变量。例如:将 cluster=~"$ClusterId"参数中的$ClusterId变量修改为具体的集群 ID ,或直接删除该参数。

查看指标

您可以使用托管 Prometheus 的 Explore 功能来快速查询和展示指标数据。详情请参见 指标查询