运维 Agent 是 ByteHouse 企业版推出的运维智能助手,支持诊断集群和查询,为您提供全面且深入的根因分析,并提供优化建议,帮助您快速定位问题,提升运维效率。本文将介绍运维 Agent 的功能概述和使用指南。
运维 Agent 当前支持集群诊断和查询诊断两大核心能力,适用于以下典型场景:
运维 Agent 能够显著提升诊断效率,快速定位异常根因,大幅缩短排查时间。运维 Agent 支持自然语言交互,大幅降低诊断门槛,为您提供专家级运维经验支持。
运维 Agent 支持智能诊断集群健康状态,可针对 CPU 或内存负载满、集群容量满等场景,针对多种可能的原因深入分析,定位主要的异常原因,并给出对应的优化处理建议。
您可单击集群列表和集群详情中的智能诊断按钮,进入智能诊断页面,运维 Agent 将自动分析当前集群最近 1 小时的健康度情况。如需分析其他集群,请单击对应集群的智能诊断按钮。
进入路径说明如下:
路径 | 说明 |
|---|---|
路径一:集群列表 | 登录 ByteHouse 企业版控制台,单击集群管理,在集群列表中,单击目标集群所在行操作列的智能诊断按钮。 |
路径二:集群详情 | 登录 ByteHouse 企业版控制台,单击集群管理,单击目标集群名称,单击右上角的智能诊断按钮。 |
单击集群对应的智能诊断按钮后,运维 Agent 将自动分析当前集群最近 1 小时的健康度情况,从 CPU、内存、运行中查询、合并任务、导入任务、异常节点、数据节点等角度进行分析,总结集群当前的健康度情况,并给出下一步分析建议。
您可根据运维 Agent 给出的提问建议,继续提问,深入分析指标异常原因。
运维 Agent 提供查询诊断能力,可对单个查询进行诊断,包括单个查询失败诊断、单个查询慢诊断。
您可通过数据查询、 Query 洞察或 SQL 历史页面的智能诊断按钮进入智能诊断页面,运维 Agent 将自动分析当前 Query ID 的查询情况。进入路径说明如下:
路径 | 说明 |
|---|---|
路径一:数据查询 | 登录 ByteHouse 企业版控制台中,单击数据查询,执行 SQL 命令,在查询结果区域,单击智能诊断按钮。 |
路径二:Query 洞察 | 登录 ByteHouse 企业版控制台,单击诊断优化,单击侧边栏的 Query 洞察,选择集群并填写 Query ID(可从 SQL 历史页面复制),单击 Query 洞察,在概览页面单击智能诊断按钮。 |
路径三:SQL 历史 | 登录 ByteHouse 企业版控制台,单击数据查询,单击 SQL 历史,在 SQL 历史列表中,您可以通过筛选或搜索功能,找到所需诊断的 SQL,单击操作列的查询诊断。ByteHouse 将跳转至 Query 洞察页面,您可在概览页面单击智能诊断按钮。 |
执行 SQL 命令时,如果出现查询失败,可单击智能诊断,运维 Agent 将自动分析当前查询情况,并给出解决方案。
历史 SQL 查询中如果存在慢查询,可在 SQL 历史页面单击查询诊断,跳转至 Query 洞察页面,单击智能诊断,运维 Agent 将自动分析该查询的执行情况,并给出解决方案。