You need to enable JavaScript to run this app.
导航

什么是服务端监控?

最近更新时间2023.09.12 11:29:52

首次发布时间2021.06.18 16:24:40

应用性能监控全链路版的服务端监控具备基础层资源性能监控、服务/代码层监控、线上应用运行健康度监控的后端全链路监控的能力。

服务端监控说明

服务端监控是应用性能监控全链路版(APM Plus)推出的针对服务端应用的后端全链路监控服务,具备从基础层资源性能监控,到服务、代码层监控,再到线上应用运行健康度监控等能力。服务端监控采用无侵入式插桩方案,您只需在服务器进行简单的配置,即可完成接入。
图片

优势

  • 接入成本低,非侵入式SDK
    • 针对Java和Python应用常规框架提供无侵入式接入,降低成本。
    • SDK和Agent性能测试消耗资源,少于开源产品。
    • Agent提供了Yum apt-get等多种部署安装方式,提高接入效率。
  • 更丰富的异常现场还原能力
    提供了丰富的现场还原能力,包括且不限于堆栈回溯、日志抓取、调度分析、Tombstone还原、用户交互还原等。
  • 更灵活的采样方式,以节省开支
    为您提供了多种采样配置,支持按功能模块设置采样、按用户设置采样,以帮助您节省事件量。
  • 提供自定义错误上报
    除常规异常问题的采集,也可上报自定义错误,更全面地分析业务所面对的异常问题。
  • 提供自定义埋点能力
    提供多种自定义埋点功能以满足不同场景:灵活可深入分析的的事件埋点、轻便简单的前端自定义打点。
  • 可提供技术优化解决方案
    对亿级用户量应用技术优化有丰富经验的技术专家组成的团队,结合平台功能,为您提供相关技术方案,助力企业优化应用品质与性能。

监控能力总览

目前服务端监控提供了以下监控能力。

分类

功能

说明

看板

主机性能

预设的主机性能看板。

磁盘

预设的磁盘性能看板。

平台自监控

预设的平台自监控看板。

自定义看板

您可以配置自定义看板。

基础监控

主机监控

展示主机列表及其运行状态、CPU使用率、IO、负载信息。

Docker监控

展示容器列表及其运行状态、宿主名称、镜像、CPU、内存使用率、启动时间、创建时间等信息。

进程监控

展示进程列表及其启动用户、主机名称、CPU、内存使用率、创建时间、结束时间等信息。

日志

日志查询

提供日志的消费能力,可以查询日志聚类和日志检索。

服务概览

服务列表

展示全体服务及其服务类型、运行状态、错误率、QPS、延时、CPU使用率、内存使用率、最近查看时间等信息。

服务拓扑

展示全局服务拓扑图,反映服务间的调用情况。可以通过服务拓扑快速梳理整体服务架构,上下游调用关系,并且可以实时看到各个服务间调用的成功率,快速发现问题服务。

服务接入

提供各语言的接入指引,您参考接入引导可以接入监控。

中间件监控

中间件概览

汇总应用服务对中间件的访问情况,从中间件视角统一观测,方便中间件维护人员对中间件进行问题排查。

链路分析

Trace分析

实时检索服务调用等span信息,支持多维检索与排序,用于快速定位错误和慢查询,单击TraceID可以查看请求完整链路。用于定位排查单点问题。

单链路查询

提供单点追踪诊断能力,可根据TraceID查询单个请求的完整调用链路,打通日志库后可串联起整个链路的所有日志。用于快速定位排查单点问题。

性能分析

分析查询

展示了所有服务的profile上报数据。

任务管理

用于新增、管理profile任务,以及查看该profile任务的上报数据。

全局分析

自定义指标

展示上报的自定义指标及其自定义维度,支持搜索与筛选,可方便的跳转到可视化查询。

可视化查询

可视化展示该指标的时间趋势图,可查看该指标随时间的变化趋势。

Watchdog

自动异常检测

自动检测可能的基础组件和服务异常,无需您干预即可检测出系统风险点,帮助您及时消除隐患,快速定位和排查线上问题。

事件中心

展示watchdog事件,可以针对事件配置告警通知。

错误追踪

错误分析

收集服务中出现的异常/错误信息,进行聚合分类,用于帮助您分析服务中的各类错误。

报警管理

报警任务

用于新增、管理报警任务。报警任务检测指标值或watchdog事件,满足条件时发送报警消息,通知运维人员及时处理,帮助运维人员快速定位和排查线上问题。

报警历史

记录告警历史,可用于查看历史告警记录。

平台管理配置

接收组管理

管理告警接收组。

参数配置

用于调整平台各类参数配置。

接入流程

您可以参考如下接入流程图,初步了解如何接入服务端监控。详细接入流程可参考如何接入服务端监控
图片

API

服务端监控还开放了报警管理、报警组管理和指标查询等相关业务的OpenAPI。详情请参见API概览