You need to enable JavaScript to run this app.
导航

有状态负载监控

最近更新时间2024.02.28 20:05:05

首次发布时间2024.02.28 20:05:05

有状态负载监控提供了集群中 StatefulSet 资源的监控信息,包括资源列表和资源详情。本文为您介绍如何查看有状态负载列表和详情信息。

说明

邀测·申请试用】:该功能目前处于 邀测 阶段,如需使用,请提交申请。

前提条件

资源列表

  1. 登录 容器服务控制台
  2. 在左侧导航栏中选择 集群
  3. 在集群列表页面,单击目标集群。
  4. 在集群管理页面的左侧导航栏中,选择 监控中心 > 资源检索

查看资源列表

在 资源类型 面板中选择 有状态负载,即可查看有状态负载列表。列表中展示了有状态负载的基本信息和指标信息。
alt

在有状态负载列表中,您可以执行以下操作:

  • 单击有状态负载名称,进入有状态负载详情页面,查看有状态负载详情。
  • 单击 容器组 列中的数字,带过滤条件跳转至容器组页面,查看该有状态负载下所有的容器组信息。
  • 单击列表右上角的 alt 图标,切换列表中的指标协议,包括:HTTP 和 DNS。

资源筛选

在有状态负载列表中,支持通过命名空间、服务和负载名称,对有状态负载进行筛选。

  1. 命名空间服务有状态负载 下拉菜单中,分别选择需要检索的信息。
  2. 单击 添加标签,配置有状态负载的标签。
    alt
    配置项说明
    标签名称配置标签名称,字符串形式。

    运算符

    配置运算符,包括:

    • 包含:表示标签中包含指定的值。
    • 不包含:表示标签中不包含指定的值。
    标签值配置标签值,字符串形式。支持配置多个标签值,通过空格输入多个标签值。

    说明

    • 支持添加多个标签进行检索。
    • 多个标签之间的关系为 ,即有状态负载必须同时包含所有标签。
  3. 单击 查询,检索有状态负载。
    alt

资源聚合

在有状态负载列表中,允许基于 命名空间服务,对有状态负载进行聚合。聚合后,有状态负载会基于聚合维度,分类显示。

  1. 聚合维度 下拉菜单中,选择聚合维度。
  2. 单击 查询,聚合有状态负载。
    alt

资源详情

在有状态负载列表中,单击目标有状态负载名称,进入详情页面。即可查看有状态负载详情,包括:基础信息、性能概览、应用监控和 YAML。

基础信息

基础信息 信息区域中,查看有状态负载的基础信息,包括:就绪数、已更新数、可用数、运行时长、标签、注释、容器组列表等信息。
alt

说明

容器组列表 中,您可以单击容器组名称,跳转至容器组详情页面,查看容器组详情。

性能概览

选择 性能概览 页签,查看有状态负载的性能概览信息,并支持设置查询的时间段。包括:

  • 服务性能:服务 QPS、服务 P90 响应延迟、服务错误数、上游视角服务可用性、调用下游视角服务成功率等。
  • 资源性能:CPU 使用信息、内存使用信息、每秒磁盘读写容量、网络带宽使用、网络丢包、网络错误、网络 Package 速率等。
  • 容器性能:容器开启线程数、容器组打开 socket 数、容器运行进程数、容器打开文件数等。
    alt

应用监控

接口概览

选择 应用监控 页签,单击 HTTP > 接口概览,查看有状态负载的接口列表和监控信息,并支持设置查询的时间段。包括:

  • 接口列表:展示了有状态负载的接口列表和监控信息,包括:QPS、P90 延迟和错误数。在列表中单击选择接口,可以查看不同接口的监控信息。
  • 监控信息:服务 QPS、服务 QPS 按上游工作负载分组(TOP 5)、服务错误数、服务错误率、服务错误数按上游工作负载分组(TOP 5)、服务错误数按状态码分组、服务 P90 响应延迟、服务 P90 响应延时按上游工作负载分组(TOP 5)。
    alt

上游调用

选择 应用监控 页签,单击 HTTP > 上游调用,查看有状态负载的调用拓扑、接口列表和监控信息,并支持设置查询的时间段。包括:

  • 调用拓扑:展示了有状态负载与上游实例的调用拓扑关系。
    alt

    说明

    在调用拓扑图中,您可以执行以下操作:

    • 单击有状态负载或上游实例的图标,选择不同的对象,查看其监控信息。
    • 将鼠标悬停在指定图标上,查看该实例的监控信息。包括 error 数和 QPS。
  • 接口列表:展示了有状态负载的接口列表和监控信息,包括:QPS、P90 延迟和错误数。在列表中单击选择接口,可以查看不同接口的监控信息。
  • 监控信息:支持查看有状态负载和上游服务的调用信息。包括:服务 QPS、服务 QPS 按上游工作负载分组、服务错误数、服务错误率、服务错误数按上游工作负载分组、服务错误数按状态码分组、服务 P90 响应延迟、服务 P90 响应延时按上游工作负载分组。
    alt

调用下游

选择 应用监控 页签,单击 HTTP > 调用下游,查看有状态负载的调用拓扑、接口列表和监控信息,并支持设置查询的时间段。包括:

  • 调用拓扑:展示了有状态负载调用下游实例的拓扑关系。
    alt

    说明

    在调用拓扑图中,您可以执行以下操作:

    • 单击有状态负载或下游实例的图标,选择不同的对象,查看其监控信息。
    • 将鼠标悬停在指定图标上,查看该实例的监控信息。包括 error 数和 QPS。
  • 接口列表:展示了有状态负载的接口列表和监控信息,包括:QPS、P90 延迟和错误数。在列表中单击选择接口,可以查看不同接口的监控信息。
  • 监控信息:支持查看有状态负载和上游服务的调用信息。包括:服务 QPS、服务 QPS 按下游接口分组、服务错误数、服务错误数按下游接口分组、P90 服务延迟、P90 服务延时按下游接口分组、TCP 流量、TCP 重传数、TCP 建连数、TCP 建连时延。
    alt

DNS 监控

选择 应用监控 页签,单击 DNS,查看有状态负载的 DNS 监控信息,并支持设置查询的时间段。包括:P90 响应延时、请求超时数、服务端错误数、服务端错误率等。
alt

YAML 信息

选择 YAML 页签,查看有状态负载的 YAML 文件内容。