## 问题描述在使用云服务器时,火山引擎提供基础监控和操作系统监控两种。基础监控是云监控从物理服务器层面提供的监控能力,会在云服务器对应的物理服务器中监控基础的 CPU、磁盘、网络指标等。操作系统监控需要通过监控插件`cloud-monitor-agent`来从实例内部进行监控。一般情况下,控制台操作系统监控无数据都是因为实例内部没有安装监控插件导致。![图片](https://lf3-volc-editor.volccdn.com/obj/volcfe/sop-public/upload...
全行使用统一的springcloud技术栈,注册中心为Eureka,为了兼容Prometheus服务发现,我们对Eureka进行二次开发使其能够模拟Consul的服务注册发现API(2.21.0版本后以支持Eureka SD),简化server端配置。我们监控主要分为资源监控和应用监控,资源监控为服务所在主机、虚机或容器的运行状态如cpu、内存、网络等,应用监控指标为应用的运行状态如接口响应时长,线程池情况,jvm运行情况等。资源监控方面,我们对社区的NodeExporter进行定...
监控等其他应用web通过堡垒机配合弹性公网IP/NAT网关实现流量接入与分发;### 3.2 东西流量在容器集群内,服务通过Kubernetes API-Server获取后端一组Service Pod真实IP,业务POD通过Calico网络进行POD与POD直接流... 数据层:通过业务逻辑数据加密及各云基础设施高可用部署,同时进行业务数据备份恢复和安全审计;- 系统层:通过对云服务器进行系统安全加固,漏洞补丁管理,云主机安全和云防火墙,确保系统安全。## 三 DevOpsSmar...
云原生业务立体化监控方案针对了七个环节进行监控:1. 拨测监控:业务质量监控;1. 前端性能监控:小程序等; 举例子:健康码白屏了,前端也要重点关注的1. 网络质量监控:国内外的网络环境差异较大 举例子:俄乌冲突下的居民用网问题1. 后端指标监控/链路监控:后端比较关注1. 服务运营日志:中间件监控(Redis、Kafka 等)1. 云资源监控:数据库、云硬盘、服务器资源、CPU、带宽 IO 等。 其实开源社区有非常...
获取云服务器的指标信息。本文为您介绍如何配置云服务器(ECS)实例监控。 说明 【邀测·申请试用】:集成中心功能目前处于 邀测 阶段,如需使用,请联系您的产品解决方案工程师。 前提条件托管 Prometheus 和云服务器,必须在相同地域。 已创建云服务器实例,并绑定公网 IP,详情请参见 购买云服务器实例。 已创建托管 Prometheus 工作区,详情请参见 创建工作区。 操作步骤步骤一:配置安全组登录 私有网络控制台。 在左侧导航栏中选择...
您可以通过云服务器控制台或云监控控制台查看监控数据。 说明 火山引擎提供的公共镜像均已自动安装云服务器监控插件,若您使用非火山引擎提供的镜像,在查看操作系统监控前,需首先在实例中安装插件并完成授权。更多内容请参考云监控概述。 通过云服务器控制台获取云服务器在实例的详情页面,提供了单独的监控数据统计页面。在该页面,您可以查看15天内云服务器实例的CPU、内存、网络出入带宽、磁盘IO带宽等监控数据。 登录云服务器控...
从3.10.0版本开始,云服务器实例支持监控TCP连接数。租户通过查看监控指标趋势或接收告警通知的方式,及时发现潜在风险并进行调整,避免对业务产生影响。TCP协议位于OSI模型的传输层,很多上层服务(例如HTTP、FTP、STMP)都依赖于TCP的支撑。理论上云服务器实例能够支持的TCP连接数越多越好,但由于实例的性能限制,需要对最大TCP连接数进行限制。对实例的TCP连接数进行监控,可以帮助用户感知实例的使用状况,并及时调整,避免因连接数不足...
公网负载均衡监控指标“出入带宽”的监控数据为什么超出了公网带宽上限? 为什么负载均衡的TCP活跃连接数与后端服务器上的连接数不一致? 如何通过监控数据快速判断负载均衡的响应时间? 配置访问日志功能后为什么没有日志信息? 为什么子用户无法查看监控数据? 负载均衡的丢失类监控指标(包括丢失连接数、丢失出入包数和丢失出入带宽)对业务有什么影响? CLB实例退订后是否支持查看历史监控数据? CLB的监控指标QPS为什么没有数据? 公...
从ECS 3.13.1版本开始,在云监控中预置云服务器的告警模板,方便用户快速创建告警规则。当前火山引擎云监控提供了灵活的告警规则定义方式。但是部分用户对监控告警不熟悉,认为自定义告警规则难度太大。这种情况下可以使用预置告警模板,一键启用即可收到告警通知。用户可以在“云监控-->告警中心-->告警模板”中一键启用告警模板: 启用后告警针对用户全部云服务器实例生效 告警模板覆盖CPU使用率(>90%)、内存使用率(>90%)和磁盘使用...
专有宿主机DDH已对接云监控,提供了对DDH的带外监控服务。带外监控数据为基础监控数据,即云服务器所在物理机的监控数据,通常用于查看趋势。本文介绍如何在云监控中查看DDH的使用情况并设置告警规则,在DDH状态异常时能够及时知晓,确保业务平稳运行。 背景信息云监控服务是云上一站式监控告警解决方案,云监控控制台是所有产品监控数据的统一入口,您可以在此查看到云服务器更丰富的监控数据和告警历史信息,详情请参见什么是云监控。 ...
云服务器监控支持在火山引擎的云服务器内部安装代理进程,从云服务器侧更细粒度的获取操作系统指标,提供更精确的指标数据。 云产品监控支持查看云服务器、裸金属服务器、容器服务、数据库、网络等多种云产品的监控... 请参见云监控指标查询。 产品分类 产品名称 弹性计算 云服务器 容器 容器服务 CDN与加速 内容分发网络 DCDN 全球加速 边缘联网SD-WAN 边缘计算-边缘智能 视频云 视频点播 视频点播CDN velmageX Serverle...
容器服务支持通过组件使用 RDMA 资源,以消除传统网络通信带给计算任务的瓶颈。同时,支持对 RDMA 网络进行监控。本文为您介绍如何配置和查看 RDMA 网络的监控信息。 说明 【邀测·申请试用】:该功能目前处于 邀测 阶段,如需使用,请提交申请。 使用限制仅支持 NVIDIA GPU 模式下,采集节点和 Pod 的 RDMA 指标。不支持 mGPU 模式。 共享(shared)模式下,仅上报节点的 RDMA 指标。 独占(exclusive)模式下,仅上报 Pod 的 RDMA 指标。 ...
高可用性 非托管组件,组件支持分片、自动扩缩容。 数据保存时间 不同规格工作区的时间不同,包括:15 天、30 天、60 天和 90 天 监控对象 集群监控 支持,监控对象更丰富,指标更全面。包括: 基础资源:包括集群、节点、容器组、容器、存储卷等。 控制面组件:包括 kube-apiserver、kube-scheduler、etcd 等。 其他资源:包括 GPU、P2P 镜像加速、Nydus、RDMA 等。 其他云产品监控 不支持。 说明 允许通过云监控提供的数据导出 exp...