You need to enable JavaScript to run this app.
导航

Yarn 监控指标

最近更新时间2024.01.29 11:39:29

首次发布时间2023.01.16 19:40:29

本文为您介绍Yarn指标的详细信息。
Yarn指标包含以下部分:

YARN-概览

纬度监控指标名称单位
节点个数当前存活的 NodeManager 个数
当前 Decommissioned 的 NodeManager 个数
当前NumDecommissioningNMs 的 NodeManager 个数
当前 Lost 的 NodeManager 个数
当前 Unhealthy 的 NodeManager 个数
Memory集群中已分配的内存资源MB
集群中可使用的内存资源MB
集群中保留的内存资源MB
集群中全部的内存资源MB
Applications采样周期内集群中运行完成的作业数
采样周期内集群中运行失败的作业数
采样周期内集群中被杀掉的作业数
采样周期内集群中等待运行的作业数
采样周期内集群中运行中的作业数
采样周期内集群中已提交的作业数
Containers集群中已分配的 Container 数目
集群中请求中的 Container 数目
集群中保留的 Container 数目
内存使用率集群当前内存资源的使用率%
Cores集群中已分配的 CPU 资源
集群中可使用的 CPU 资源
集群中保留的 CPU 资源
集群中全部的 CPU 资源
CPU 使用率集群当前 CPU 资源的使用率%
AM 启动数量AM 启动数量
RM 启动 AM 的平均时间RM 启动 AM 的平均时间ms
注册的 AM 总数注册的 AM 总数
AM 注册到 RM 的平均时间AM 注册到 RM 的平均时间ms

YARN-Queues

已包含在概览中

纬度监控指标名称单位

CPU 核数

当前队列分配的 VCore 个数

当前队列中 reserved 的 VCore 个数
当前队列可用的 VCore 个数
当前队列的资源请求中 pending 的 VCore 个数
应用总数当前队列历史提交作业个数
当前队列正在运行的作业个数
当前队列 pending 的作业个数
当前队列完成的作业个数
当前队列 kill 掉的作业个数
当前队列失败的作业个数
当前队列中 active 的作业个数
当前队列中运行作业运行时间小于60分钟的作业个数
当前队列中运行作业运行时间介于60~300分钟的作业个数
当前队列中运行作业运行时间介于300~1440分钟的作业个数
当前队列中运行作业运行时间大于1440分钟的作业个数
内存大小当前队列分配的内存大小MB
当前队列可用的内存大小MB
当前队列的资源请求中 pending 的内存大小MB
当前队列中 reserved 内存大小MB
容器个数当前队列分配的 container 个数
当前队列的资源请求中 pending 的 container 个数
当前队列中 reserved 的 container 个数
容器分配释放总数当前队列分配的 container 总数
当前队列 release 的 container 总数
当前队列 preempt 的 container 总数
用户数当前队列活跃用户数

YARN-ResourceManager

纬度监控指标名称单位
RPC 认证授权数RPC authentication 失败个数

RPC authentication 成功个数

RPC authorization 失败个数

RPC authorization 成功个数

RPC 接收发送数据量

RPC 接收数据量

bytes/s

RPC 发送数据量bytes/s
RPC 连接数当前打开的连接个数
RPC 请求次数RPC 请求次数
RPC Queue 请求次数
RPC 队列长度RPC 当前队列长度
RPC 平均处理时间RPC 请求平均处理时间s
RPC 在 Queue 中平均时间s
GC 次数Young GC 次数
Full GC 次数
GC 时间Full GC 消耗时间s
垃圾回收时间消耗s
Young GC 消耗时间s
内存区域占比Survivor 0区内存使用占比%
Eden 区内存使用占比%
Compressed class space 区内存使用占比%
Survivor 1区内存使用占比%
Old 区内存使用占比%
Metaspace 区内存使用占比%
JVM 线程数量处于 NEW 状态的线程数量
处于 RUNNABLE 状态的线程数量
处于 BLOCKED 状态的线程数量
处于 WAITING 状态的线程数量
处于 TIMED WAITING 状态的线程数量
处于 Terminated 状态的线程数量
JVM 日志数量Fatal 日志数量
Error 日志数量
Warn 日志数量
Info 日志数量
JVM 内存进程使用的非堆内存大小MB
进程 commit 的非堆内存大小MB
进程使用的堆内存大小MB
进程 commit 的堆内存大小MB
进程最大的堆内存大小MB
进程最大内存大小MB
CPU 利用率CPU 利用率%
CPU 累计使用时间CPU 累计使用时间ms
文件描述符数最大文件描述符数

打开文件描述符数

进程运行时长

进程运行时长

s

工作线程数进程的 Daemon 线程个数

进程的线程个数

YARN-NodeManager

纬度监控指标名称单位
GC 次数Young GC 次数
Full GC 次数
GC 时间Full GC 消耗时间s
垃圾回收时间消耗s
Young GC 消耗时间s
内存区域占比Survivor 0区内存使用占比%
Eden 区内存使用占比%
Compressed class space 区内存使用占比%
Survivor 1区内存使用占比%
Old 区内存使用占比%
Metaspace 区内存使用占比%
JVM 线程数量处于 NEW 状态的线程数量
处于 RUNNABLE 状态的线程数量
处于 BLOCKED 状态的线程数量
处于 WAITING 状态的线程数量
处于 TIMED WAITING 状态的线程数量
当前 TERMINATED 状态线程数量
JVM 日志数量FATAL 级别日志数量
ERROR 级别日志数量
WARN 级别日志数量
INFO 级别日志数量
JVM 内存进程使用的非堆内存大小MB
进程 commit 的非堆内存大小MB
进程使用的堆内存大小MB
进程 commit 的堆内存大小MB
进程最大的堆内存大小MB
进程最大内存大小MB
容器总数launch 的 container 个数
运行完成的 container 个数
失败的 container 个数
被 kill 的 container 个数
初始化中的 container 个数
正在运行的 container 个数
NodeManager 分配的 container 数量

容器启动平均耗时

容器启动平均耗时

ms

容器启动操作数容器启动操作数
CPU 核数NodeManager 可用的 VCore 个数
NodeManager 分配的 VCore个数
内存大小NodeManager 分配的内存大小GB
NodeManager 可用的内存大小GB
CPU 利用率CPU 利用率%
CPU 累计使用时间CPU 累计使用时间ms
文件描述符数最大文件描述符数
打开文件描述符数
进程运行时长进程运行时长s

工作线程数

进程的 Daemon 线程个数

进程的线程个数

YARN-TimeLineSever

标题描述单位

JVM 内存使用

TimelineServer 非堆空间使用量

MB

TimelineServer 非堆空间Committed量MB
TimelineServer 非堆空间最大值MB
TimelineServer 堆空间使用量MB
TimelineServer 堆空间Committed量MB
TimelineServer 堆空间最大值MB
TimelineServer 内存最大值MB
GC 情况TimelineServer GC 次数count
TimelineServer GC 耗时ms
操作频率TimelineServer GetEntities 操作频率次/s
TimelineServer GetEntity 操作频率次/s
TimelineServer GetEvents 操作频率次/s
TimelineServer PostEntities 操作频率次/s
TimelineServer GetDomain 操作频率次/s
TimelineServer PutDomain 操作频率次/s
TimelineServer GetDomains 操作频率次/s
操作平均耗时TimelineServer GetEntities 操作平均耗时ms
TimelineServer GetEntity 操作平均耗时ms
TimelineServer GetEvents 操作平均耗时ms
TimelineServer PostEntities 操作平均耗时ms
TimelineServer GetDomain 操作平均耗时ms
TimelineServer PutDomain 操作平均耗时ms
TimelineServer GetDomains 操作平均耗时ms