You need to enable JavaScript to run this app.
导航
运维 Agent
最近更新时间:2025.10.29 10:28:56首次发布时间:2025.10.29 10:28:56
复制全文
我的收藏
有用
有用
无用
无用

运维 Agent 是 ByteHouse 企业版推出的运维智能助手,支持诊断集群和查询,为您提供全面且深入的根因分析,并提供优化建议,帮助您快速定位问题,提升运维效率。本文将介绍运维 Agent 的功能概述和使用指南。

功能概述

运维 Agent 当前支持集群诊断和查询诊断两大核心能力,适用于以下典型场景:

  • 集群健康度诊断:当集群触发 CPU 或内存负载高、磁盘容量高等告警时,运维 Agent 可快速定位由大查询、合并任务、数据变更任务等引起的核心根因,并给出优化建议。
  • 查询失败/慢诊断:
    • 针对查询失败:运维 Agent 可一键快速分析查询失败原因,并提供解决方案,包括查询调优建议、自动改写查询 SQL 等能力。
    • 针对慢查询:运维 Agent 将深入分析查询慢原因,依据最佳实践给出查询优化建议。

运维 Agent 能够显著提升诊断效率,快速定位异常根因,大幅缩短排查时间。运维 Agent 支持自然语言交互,大幅降低诊断门槛,为您提供专家级运维经验支持。

使用限制
  • 该功能为 Beta 功能,如需使用,请提交工单或联系 ByteHouse 团队获取白名单权限。
  • 仅具有 System admin 或 Cluster admin 角色的用户才可使用该功能。

使用集群诊断

运维 Agent 支持智能诊断集群健康状态,可针对 CPU 或内存负载满、集群容量满等场景,针对多种可能的原因深入分析,定位主要的异常原因,并给出对应的优化处理建议。

进入路径

您可单击集群列表和集群详情中的智能诊断按钮,进入智能诊断页面,运维 Agent 将自动分析当前集群最近 1 小时的健康度情况。如需分析其他集群,请单击对应集群的智能诊断按钮。
进入路径说明如下:

路径

说明

路径一:集群列表

登录 ByteHouse 企业版控制台,单击集群管理,在集群列表中,单击目标集群所在行操作列的智能诊断按钮。
Image

路径二:集群详情

登录 ByteHouse 企业版控制台,单击集群管理,单击目标集群名称,单击右上角的智能诊断按钮。
Image

使用示例

示例:集群健康度诊断

单击集群对应的智能诊断按钮后,运维 Agent 将自动分析当前集群最近 1 小时的健康度情况,从 CPU、内存、运行中查询、合并任务、导入任务、异常节点、数据节点等角度进行分析,总结集群当前的健康度情况,并给出下一步分析建议。
Image
您可根据运维 Agent 给出的提问建议,继续提问,深入分析指标异常原因。
Image

使用查询诊断

运维 Agent 提供查询诊断能力,可对单个查询进行诊断,包括单个查询失败诊断、单个查询慢诊断。

进入路径

您可通过数据查询、 Query 洞察或 SQL 历史页面的智能诊断按钮进入智能诊断页面,运维 Agent 将自动分析当前 Query ID 的查询情况。进入路径说明如下:

路径

说明

路径一:数据查询

登录 ByteHouse 企业版控制台中,单击数据查询,执行 SQL 命令,在查询结果区域,单击智能诊断按钮。
Image

路径二:Query 洞察

登录 ByteHouse 企业版控制台,单击诊断优化,单击侧边栏的 Query 洞察,选择集群并填写 Query ID(可从 SQL 历史页面复制),单击 Query 洞察,在概览页面单击智能诊断按钮。
Image

路径三:SQL 历史

登录 ByteHouse 企业版控制台,单击数据查询,单击 SQL 历史,在 SQL 历史列表中,您可以通过筛选或搜索功能,找到所需诊断的 SQL,单击操作列的查询诊断。ByteHouse 将跳转至 Query 洞察页面,您可在概览页面单击智能诊断按钮。
Image

使用示例

示例 1:查询失败

执行 SQL 命令时,如果出现查询失败,可单击智能诊断,运维 Agent 将自动分析当前查询情况,并给出解决方案。
Image

示例 2:查询慢

历史 SQL 查询中如果存在慢查询,可在 SQL 历史页面单击查询诊断,跳转至 Query 洞察页面,单击智能诊断,运维 Agent 将自动分析该查询的执行情况,并给出解决方案。
Image