更新时间:2022.12.12 17:41:02
应用性能监控全链路版的服务端监控具备基础层资源性能监控、服务/代码层监控、线上应用运行健康度监控的后端全链路监控的能力。
服务端监控是应用性能监控全链路版(APM Plus)推出的针对服务端应用的后端全链路监控服务,具备从基础层资源性能监控,到服务、代码层监控,再到线上应用运行健康度监控等能力。服务端监控采用无侵入式插桩方案,您只需在服务器进行简单的配置,即可完成接入。
接入成本低,非侵入式SDK
针对Java和Python应用常规框架提供无侵入式接入,降低成本。
SDK和Agent性能测试消耗资源,少于开源产品。
Agent提供了Yum apt-get等多种部署安装方式,提高接入效率。
更丰富的异常现场还原能力
提供了丰富的现场还原能力,包括且不限于堆栈回溯、日志抓取、调度分析、Tombstone还原、用户交互还原等。
更灵活的采样方式,以节省开支
为您提供了多种采样配置,支持按功能模块设置采样、按用户设置采样,以帮助您节省事件量。
提供自定义错误上报
除常规异常问题的采集,也可上报自定义错误,更全面地分析业务所面对的异常问题。
提供自定义埋点能力
提供多种自定义埋点功能以满足不同场景:灵活可深入分析的的事件埋点、轻便简单的前端自定义打点。
可提供技术优化解决方案
对亿级用户量应用技术优化有丰富经验的技术专家组成的团队,结合平台功能,为您提供相关技术方案,助力企业优化应用品质与性能。
目前服务端监控提供了以下监控能力。
分类 | 功能 | 说明 |
---|---|---|
看板 | 主机性能 | 预设的主机性能看板。 |
磁盘 | 预设的磁盘性能看板。 | |
平台自监控 | 预设的平台自监控看板。 | |
自定义看板 | 您可以配置自定义看板。 | |
主机监控 | 展示主机列表及其运行状态、CPU使用率、IO、负载信息。 | |
Docker监控 | 展示容器列表及其运行状态、宿主名称、镜像、CPU、内存使用率、启动时间、创建时间等信息。 | |
进程监控 | 展示进程列表及其启动用户、主机名称、CPU、内存使用率、创建时间、结束时间等信息。 | |
日志 | 日志查询 | 提供日志的消费能力,可以查询日志聚类和日志检索。 |
服务列表 | 展示全体服务及其服务类型、运行状态、错误率、QPS、延时、CPU使用率、内存使用率、最近查看时间等信息。 | |
服务拓扑 | 展示全局服务拓扑图,反映服务间的调用情况。可以通过服务拓扑快速梳理整体服务架构,上下游调用关系,并且可以实时看到各个服务间调用的成功率,快速发现问题服务。 | |
服务接入 | 提供各语言的接入指引,您参考接入引导可以接入监控。 | |
中间件监控 | 中间件概览 | 汇总应用服务对中间件的访问情况,从中间件视角统一观测,方便中间件维护人员对中间件进行问题排查。 |
链路分析 | Trace分析 | 实时检索服务调用等span信息,支持多维检索与排序,用于快速定位错误和慢查询,单击TraceID可以查看请求完整链路。用于定位排查单点问题。 |
单链路查询 | 提供单点追踪诊断能力,可根据TraceID查询单个请求的完整调用链路,打通日志库后可串联起整个链路的所有日志。用于快速定位排查单点问题。 | |
性能分析 | 分析查询 | 展示了所有服务的profile上报数据。 |
任务管理 | 用于新增、管理profile任务,以及查看该profile任务的上报数据。 | |
全局分析 | 自定义指标 | 展示上报的自定义指标及其自定义维度,支持搜索与筛选,可方便的跳转到可视化查询。 |
可视化查询 | 可视化展示该指标的时间趋势图,可查看该指标随时间的变化趋势。 | |
自动异常检测 | 自动检测可能的基础组件和服务异常,无需您干预即可检测出系统风险点,帮助您及时消除隐患,快速定位和排查线上问题。 | |
事件中心 | 展示watchdog事件,可以针对事件配置告警通知。 | |
错误追踪 | 错误分析 | 收集服务中出现的异常/错误信息,进行聚合分类,用于帮助您分析服务中的各类错误。 |
报警管理 | 报警任务 | 用于新增、管理报警任务。报警任务检测指标值或watchdog事件,满足条件时发送报警消息,通知运维人员及时处理,帮助运维人员快速定位和排查线上问题。 |
报警历史 | 记录告警历史,可用于查看历史告警记录。 | |
平台管理配置 | 接收组管理 | 管理告警接收组。 |
参数配置 | 用于调整平台各类参数配置。 |
您可以参考如下接入流程图,初步了解如何接入服务端监控。详细接入流程可参考如何接入服务端监控。
服务端监控还开放了报警管理、报警组管理和指标查询等相关业务的OpenAPI。详情请参见API概览。