最近更新时间:2024.02.29 11:18:35
首次发布时间:2023.08.29 22:38:12
随着 Kubernetes 的广泛使用,云原生架构给可观测性带来了新的挑战。在微服务和容器化的背景下,您需要充分了解应用程序以及 Kubernetes 基础设施的运行状态,快速定位并解决出现的问题,同时需要对应用以及集群运行状态数据的收集和分析,持续优化和改进,从而保证运行环境安全可靠。
本文为您介绍容器服务可观测性系统的组成,以及基于火山引擎云产品实现容器服务可观测系统构建的最佳实践。
Kubernetes 系统对于可观测性方面的挑战包括:
针对 Kubernetes 系统的可观测性挑战,尤其在集群规模快速增长的情况下,高效可靠的 Kubernetes 系统可观测性能力,是系统稳定性保障的基石。
在云原生架构中,可观测性(Observability)一般是指三个具体的方向,分别为:日志事件(Logging)、链路追踪(Tracing) 和 聚合指标(Metrics)。
容器服务基于火山引擎 日志服务,提供集群的日志持久化存储、查询等功能。
项目 | 说明 |
---|---|
日志类型 | 支持集群、应用的多种类型日志,包括:
|
日志存储 | 支持海量数据的持久化存储,性能稳定、读写便捷。 |
检索分析 | 支持使用关键词检索日志,快速定位异常事件;同时支持使用 SQL 对日志进行实时统计与分析,快速获取关键数据。 |
可视化 | 查询与分析结果支持可视化展示,支持多维度的统计图表类型和自定义的交互式仪表盘,辅助数据的实时监控与运营。 |
说明
日志服务支持海量数据秒级查询分析,提供高效实时的日志处理工具,降低了日志类数据的使用门槛,有效提升运维能力及数据分析效率。当集群发生故障时,您可以从日志服务中查看过去的日志信息,进行故障排查。
Kubernetes 事件是一个对象,它显示集群、节点、Pod 或容器内发生的事情。这些对象通常是为了响应 Kubernetes 系统内部发生的变化而生成的。Kubernetes 事件能够帮助用户深入了解集群的健康和性能。事件一般分为 2 种:
容器服务基于火山引擎 日志服务,提供集群的事件和持久化存储、查询等功能。
容器服务支持通过火山引擎云监控、托管 Prometheus 或云原生观测方案,实现集群、基础资源和应用指标(Metrics)的采集、监控和告警。
方案介绍 | 方案介绍 | 相关文档 |
---|---|---|
云监控 | 火山引擎云监控服务是火山引擎云上一站式监控告警解决方案。可以收集并可视化展示各类云产品的资源状态,帮助您全面了解其健康状况。您可以将容器服务集群接入云监控产品,帮助您收集并可视化展示容器服务集群、节点、命名空间、工作负载、容器组和容器等多种资源状态。 | 什么是云监控 |
托管 Prometheus | 火山引擎托管 Prometheus(Volcengine Managed Service for Prometheus,VMP)是完全继承和对接开源 Prometheus 生态,并托管在火山引擎云端的监控产品。兼容开源 Prometheus 的接口以及社区 Exporter 生态,提供免搭建、免运维的 Prometheus 集成环境,减少开发及运维成本。 | 什么是托管 Prometheus |
云原生观测 | 云原生观测是针对容器服务集群提供的一体化可观测性解决方案。在基础观测能力之上,提供了基于 eBPF 实现的代码零侵入指标采集方式,实现面向 Kubernetes 集群、组件、资源、网络、应用和服务的指标和链路监控。 | 云原生监控 |
说明
容器服务指标监控的详细介绍和方案对比,请参见 监控概述。