文档中心

简体

文档备案控制台

托管 Prometheus

文档指南

托管 Prometheus

托管 Prometheus

文档指南

请输入

产品动态

新功能发布记录

历史功能发布记录

新功能发布记录（2024 年）

新功能发布记录（2023 年）

产品公告

【产品变更】控制台登录入口切换至全栈可观测平台

【产品变更】OpenAPI（ListWorkspaces）变更通知

【产品变更】容器服务 Prometheus-agent 组件升级

【产品变更】托管 Prometheus 正式商业化公告

关于运营商禁止短信内容包含链接、IP地址、联系方式的公告

产品简介

什么是托管 Prometheus

产品优势

产品功能

应用场景

地域和可用区

基本概念

使用限制

Prometheus 基础知识

数据格式和指标类型

Prometheus 时序数据格式

Prometheus Metrics 类型

指标 Relabel

PromQL 入门

什么是 PromQL

PromQL 基本用法

PromQL 选择器

PromQL 操作符

PromQL 聚合操作

PromQL 常用函数

产品计费

计费概述

计费方式

按量计费

资源包

资源包概述

购买资源包

查看资源包

续订资源包

退订和更配

价格计算器

欠费说明

项目分账

标签分账

税率和发票

快速入门

用户指南

工作区

工作区概述

工作区类型

工作区选择

创建工作区

创建通用工作区

创建本地工作区

创建聚合查询工作区

工作区更配

修改工作区数据存储时长

修改工作区规格参数

获取工作区地址

工作区监控

管理工作区

流量管控

流量管控

管理 PromQL 封禁策略

慢查询

Recording Rule

创建 Recording Rule

管理 Recording Rule

跨账号/地域工作区聚合

资源消耗

Explore

指标查询

查询历史

监控看板

预置看板

基础操作

告警中心

告警概述

联系人

创建联系人

创建联系人组

告警规则

创建告警规则

管理告警规则

创建告警规则组

管理告警规则组

告警规则模板

自定义告警规则模板

预置告警规则模版

告警通知策略

创建告警通知策略

管理告警通知策略

通知消息模板

创建通知消息模板

管理通知消息模版

扩展函数与变量

告警聚合策略

创建告警聚合策略

管理告警聚合策略

告警静默策略

创建告警静默策略

管理告警静默策略

查看告警

接入中心

指标导出

导出指标至 Kafka 消息队列

导出指标至自建 Prometheus

导出指标至 TOS 对象存储

权限管理

权限概述

配置 IAM 权限

配置项目级权限

可视化开发

控制台内嵌

控制台内嵌参数

接入指南

接入概述

云服务接入

容器服务接入

容器集群接入

自定义采集

云服务器接入

GPU/RDMA 毫秒级监控接入

云监控接入

其他云服务接入

Kafka 接入

Nacos 接入

Prometheus Federation 接入

SGLang 接入

Ray 接入

vLLM 接入

Dynamo 接入

ETCD 接入

健康巡检（Blackbox）接入

容器存储指标接入

自建 Kubernetes 集群接入

采集方案概述

部署脚本

获取脚本

脚本使用指南

高可用采集方案

部署 VM Agent

管理 VM Agent

组件扩容

告警和运维建议

自定义接入

自定义业务接入

Golang 应用接入

Exporter 接入

Nginx Exporter 接入

Kafka Exporter 接入

Redis Exporter 接入

MySQL Exporter 接入

PostgreSQL Exporter 接入

MongoDB Exporter 接入

ElasticSearch Exporter 接入

RabbitMQ Exporter 接入

最佳实践

在容器服务集群中部署 Grafana 并接入工作区

在云服务器实例中部署 Grafana 并接入工作区

使用本地工作区关联本地 Prometheus 实例

使用代理实现工作区公网访问

使用专线连接和私网连接实现跨云工作区访问

使用云企业网和私网连接实现跨地域工作区访问

使用 Go 语言实现工作区数据写入和查询

使用 Pushgateway 推送数据

使用 Federate 端点抓取工作区中的时间序列

容器服务监控常用大盘

监控容器服务中的 AI 训练任务

使用 node-exporter 监控 ECS 实例

监控 ECS 实例中的应用

监控 veImageX 云服务

监控腾讯云资源

监控自定义 Kubernetes 集群

监控自定义 Kubernetes 集群中的 GPU

使用 vmalert 对接 VMP 进行告警

Prometheus-agent 稳定性提升最佳实践

通过 Remote Write 地址将开源 Prometheus 数据写入托管 Prometheus 工作区

对话即运维：基于MCP服务管理VMP

告警中心

使用邮件接收告警通知

使用飞书自定义机器人接收告警通知

使用飞书应用机器人接收告警通知

使用钉钉接收告警通知

使用企业微信接收告警通知

使用电话接收告警通知

使用短信接收告警通知

API 参考

API 发布历史

使用前必读

API 列表

API 错误码列表

调用方式

请求结构

服务地址

公共参数

签名机制

返回结构

工作区

CreateWorkspace

UpdateWorkspace

DeleteWorkspace

ListWorkspaces

ListWorkspaceInstanceTypes

ListWorkspaceStatus

GetWorkspace

GetWorkspaceAuthInfo

Recording Rule

CreateRuleFile

DeleteRuleFile

GetRuleFile

ListRuleFiles

ListRules

UpdateRuleFile

告警中心

联系人

CreateContact

DeleteContacts

ListContacts

UpdateContact

CreateContactGroup

DeleteContactGroups

ListContactGroups

UpdateContactGroup

SendValidationMessage

TestWebhook

TestLarkBotWebhook

TestDingTalkBotWebhook

TestWeComBotWebhook

告警通知策略

CreateNotifyPolicy

DeleteNotifyPolicy

ListNotifyPolicies

UpdateNotifyPolicy

告警规则

CreateAlertingRule

DeleteAlertingRules

DisableAlertingRules

EnableAlertingRules

ListAlertingRules

UpdateAlertingRule

告警聚合策略

CreateNotifyGroupPolicy

DeleteNotifyGroupPolicy

ListNotifyGroupPolicies

UpdateNotifyGroupPolicy

通知消息模版

CreateNotifyTemplate

UpdateNotifyTemplate

ListNotifyTemplates

DeleteNotifyTemplate

告警静默策略

CreateSilencePolicy

UpdateSilencePolicy

EnableSilencePolicies

DisableSilencePolicies

DeleteSilencePolicies

ListSilencePolicies

查看告警

ListAlertSamples

ListAlerts

资源标签

TagResources

UntagResources

ListTagsForResources

接入任务

CreateIntegrationTask

UpdateIntegrationTask

GetIntegrationTask

DeleteIntegrationTask

ListIntegrationTasks

EnableIntegrationTasks

DisableIntegrationTasks

SDK 参考

SDK 概览

指标参考

容器服务指标

API Server 指标

metrics-server 指标

kubelet 指标

nvidia-device-plugin 指标

npu-a-device-plugin 指标

mgpu 指标

rdma-device-plugin 指标

vpc-cni 指标

node-exporter 指标

kube-state-metrics 指标

cAdvisor 指标

csi-ebs 指标

core-dns 指标

node-local-dns 指标

cr-credential-controller 指标

image-accelerator 指标

p2p-accelerator 指标

ingress-nginx 指标

katalyst 指标

kube-controller-manager 指标

云服务器指标

API 网关指标

微服务引擎指标

常见问题

存量标准版实例数据迁移说明

如何在集群中创建 ServiceMonitor 等 CRD 资源？

如何删除服务发现配置？

通用 Webhook 格式说明

使用通用 Webhook 无法收到告警信息

如何查看指标数据？

无法正确查看到预期的指标？

提示“AccessDenied,Code:403”错误如何解决？

如何提升配额（Quota）？

托管 Prometheus 中 increase 查询结果为什么和预期不一样？

视频帮助

玩转容器服务 VKE 监控

相关协议

托管 Prometheus 专用服务条款

托管 Prometheus 产品服务等级协议

文档首页

托管 Prometheus

复制全文

下载 pdf

我的收藏

托管 Prometheus

复制全文

下载 pdf

我的收藏

文档反馈

问问助手

最近更新时间：

这个页面对您有帮助吗？

有用

有用

无用

无用