You need to enable JavaScript to run this app.
导航

基本概念

最近更新时间2023.06.06 10:27:33

首次发布时间2023.06.06 10:27:33

在创建工作区前,您首先需要了解与工作区相关的基本概念,方便您基于实际需求,选择合理规格的工作区。

实例类型

托管 Prometheus 为您提供了 2 种不同的工作区实例类型,分别为:标准版企业版。不同实例类型包括不同的实例规格。主要区别为:数据存储天数、最大活跃时序数、最大指标摄入速率、查询 QPS 等。详情请参见 工作区规格

数据存储天数

数据存储天数,即采集到的指标在托管 Prometheus 工作区中的保存时间。主要包括:15 天、30 天、60 天和 90 天等。从该指标被采集并保存在工作区开始算起,在该时间段内,您可以随时查询该数据。但超过该时间后,该数据将会被删除,无法再查询。

因此,您需要根据数据保存的时间需求,合理选择数据需要保存的时间。下图展示了数据存储天数为 30 天的工作区内,数据入库、可查询和删除的时间轴。
alt

最大活跃时序数

最大活跃时序数是评估数据规模最重要的参考因素。您需要基于监控的对象(Kubernetes 集群、应用等)估算合理的所需最大活跃时序数。

时间序列

时间序列,简称为 时序,是 Prometheus 数据的基本组成。一个时间序列由 指标名称(metrics name) 和一组 标签集(labelset) 命名,并按照时间戳进行排列。

  • 每个时间序列都有一个名称。例如:
    • node_cpu_seconds_total - 节点 CPU 的使用时间
    • node_filesystem_free_bytes - 文件系统挂载点上的可用空间
    • kube_pod_status_ready - 集群中所有处于 Ready 状态的 Pod
  • 每个时间序列可以有多个 label="value" 标签。例如:
    • node_cpu_seconds_total{cluster="ccdxxx",host_ip="10.10.128.2"}
    • kube_pod_status_ready{namespace="default"}
  • 如果两个时间序列的名称或者标签的键值有任何一个不同,那么就被定义为不同的时间序列。例如下面的示例就为 3 个时间序列:
    • kube_pod_status_ready
    • kube_pod_status_ready{namespace="default"}
    • kube_pod_status_ready{namespace="volcano-metrics"}

说明

时间序列的更多细节,请参见 Prometheus 时序数据格式

活跃时序

如果一个时间序列在指定时间(1 小时)内被抓取到新数据,那么它被称为活跃时间序列。

活跃时序数与工作区的写入能力有直接相关。如果您的最大活跃时序数超过了工作区的配额,会导致所采集的到数据被丢弃。因此,您需要根据实际情况,合理估算最大活跃时序数。