产品概述
功能简介
- ByteHouse 作为火山引擎云原生多模态数据平台,已经具备极致 OLAP 性能、万亿级数据秒级响应、原生向量索引、多模态一体化存储等核心能力。但在 AI 原生时代,传统数据分析方式依然需要专业 SQL 技能,无法让每个业务人员直接对话数据。
- ByteHouse 官方技能通过 ArkClaw Skills 无缝接入,将产品能力封装为可直接调用的技能,每个人都能用自然语言直接对话数据,实现"数据仓库 + AI 编排"的开箱即用组合,让企业数据分析真正进入 AI 原生时代。
功能定位
- ByteHouse Skills 扩展了 ArkClaw 在数据检索、分析、运维领域的能力边界,依托 ByteHouse 极致性能和原生向量能力,让 AI Agent 在企业数据场景真正规模落地,帮助客户更快实现数据分析的智能化转型,与 ArkClaw 组合提升竞争力,提升客户粘性。
业务价值
- 客户获得的不仅是七个孤立工具,而是一套开箱即用的 AI 原生数据分析完整方案。它让企业中每个业务人员都能直接用自然语言查询数据,不用再等待分析师排期,大幅缩短决策链路,加速企业数据驱动转型,最终将数据资产转化为实实在在的业务增长与效率提升。
ByteHouse Skills 列表
序号 | Skill 名称 | Skill 介绍 | 上线 火山 Skills Hub |
|---|
1 | MCP 连接技能
byted-bytehouse-mcp | - 【一句话】基于 MCP 协议连接 ByteHouse,提供标准化工具接口
- 【应用场景】AI Agent 操作数据库,所有其他技能的基础依赖
- 【核心卖点】遵循开放协议,稳定连接,支持查询、DDL、DML 各类操作
| ✅ 已上线 |
2 | 混合检索 Skill
byted-bytehouse-hybrid-search | - 【一句话】全文检索 + 向量检索混合召回,RRF 重排提升准确率
- 【应用场景】企业知识库搜索、文档问答
- 【核心卖点】ByteHouse 原生向量索引,性能比传统方案快 5-10x,准确率提升 35%
| ✅ 已上线 |
3 | 多模态检索 Skill
byted-bytehouse-multimodal-search | - 【一句话】文本/图片/视频三种模态统一向量化存储和检索
- 【应用场景】素材搜索、以图搜图、舆情监控
- 【核心卖点】原生多模态支持,百亿向量毫秒级返回,准确率提升 40%
| ✅ 已上线 |
4 | 数据资产分析 Skill
byted-bytehouse-data-asset-analyzer | - 【一句话】自动生成数据资产目录,分析表之间血缘关系
- 【应用场景】数据资产盘点、自助数据分析前置
- 【核心卖点】自动获取 schema、自动打标签、血缘分析,提升 Agent 写 SQL 准确率
| ✅ 已上线 |
5 | 集群诊断 Skill
byted-bytehouse-diagnostics | - 【一句话】集群健康检查和异常问题诊断
- 【应用场景】运维故障排查、集群健康巡检
- 【核心卖点】自动化检查连接、副本、分区、节点状态,分钟级输出诊断报告
| ✅ 已上线 |
6 | 负载分析 Skill
byted-bytehouse-load-analyzer | - 【一句话】集群负载分析和资源使用监控
- 【应用场景】性能瓶颈识别、容量评估
- 【核心卖点】多维度(资源/时间/表)分析,可视化趋势,精准定位瓶颈
| ✅ 已上线 |
7 | 慢查询分析 Skill
byted-bytehouse-slow-query | - 【一句话】慢查询识别分析,生成优化建议
- 【应用场景】查询性能优化
- 【核心卖点】自动获取执行计划,识别瓶颈,给出索引、重写、参数调优建议
| ✅ 已上线 |
快速开始
前提条件
- 开通 ByteHouse 云服务:快速开始--ByteHouse云数仓版-火山引擎
- 开通 火山引擎 ArkClaw:一键接入 ArkClaw
- 配置 ByteHouse 连接信息(HOST、PORT、USER、API Key):获取 ByteHouse 连接信息--ByteHouse云数仓版-火山引擎
- 检索功能需 配置火山方舟 API Key 用于向量化:快速入门--火山方舟-火山引擎
计费方式
- 如何收费:Skills 本身不独立收费,资源消耗(ByteHouse 计算、存储、方舟模型)按照火山引擎官网刊例价正常计费,和现有 ByteHouse 计费完全一致。
通过 ArkClaw 使用
第一步:配置环境变量
- 在飞书机器人或者ArkClaw对话框,通过自然语言提问,首次提问会要求提供必要的配置信息

# ByteHouse 连接信息
export BYTEHOUSE_HOST="tenant-xxxxxx-cn-shanghai-public.bytehouse.volces.com"
export BYTEHOUSE_PORT="19000"
export BYTEHOUSE_USER="bytehouse"
export BYTEHOUSE_PASSWORD="<your-password>"
# 火山引擎方舟 API(向量化需要)
export ARK_API_KEY="<your-ark-api-key>
💡 提示:doubao-embedding-vision-251215 模型不支持自定义 dimensions 参数,技能会自动适配实际返回维度(通常为 2048 维)。
第二步:安装ByteHouse Skills


第三步:开始使用
- 在对话中直接用自然语言提问即可,比如:"帮我看看 ByteHouse 中有哪些数据库,输出前10个"

应用场景
场景一:内容平台 — 多媒体素材知识库搜索
- 业务场景:内容平台积累大量文章、图片、视频素材,搜索不准确,找不到想要素材。
- 联动方案:ByteHouse(存储计算) + ArkClaw(编排) + ByteHouse 多模态检索 Skill
- 链路拆解:
- ByteHouse:提供极致性能的多模态存储和检索
- ArkClaw:逻辑编排的"敏捷大脑",理解用户搜索意图
- ByteHouse 多模态检索 Skill:统一向量化 → 混合检索 → 返回最匹配结果
- 业务效果:
- 之前:搜索依赖关键词匹配,找素材需要小时级,准确率低。
- 之后:基于语义理解,素材搜索准确率提升 40%,找素材时间从小时级降到分钟级,内容推荐点击率提升 25%。
场景二:企业服务 — 人人可用的自助数据分析
- 业务场景:各部门都有数据分析需求,DBA/分析师排期长,无法满足业务快速迭代。
- 联动方案:ByteHouse(存储计算)+ ArkClaw(编排) + MCP Skill + 数据资产分析 Skill
- 链路拆解:
- ByteHouse:提供万亿级秒级响应的计算能力
- ArkClaw:理解自然语言需求,生成 SQL 并解释结果
- 数据资产分析 Skill:提前获取表结构和血缘,大幅提升 SQL 生成准确率
- 业务效果:
- 之前:业务提需求 → 排期 → 等待 → 拿到结果,整个流程从天到天,响应太慢。
- 之后:业务人员直接用自然语言提问,几分钟拿到结果,分析师自助率提升 70%,DBA 负载降低 60%,响应从天级降到分钟级。
场景三:运维 — 智能集群性能诊断
- 业务场景:集群性能问题需要人工排查,慢查询定位慢,影响业务稳定性。
- 联动方案:ByteHouse(存储计算)+ ArkClaw(编排) + 诊断 Skill + 负载分析 Skill + 慢查询 Skill
- 链路拆解:
- 诊断 Skill:做全面集群健康检查
- 负载分析 Skill:分析资源负载趋势,识别瓶颈
- 慢查询 Skill:定位慢查询,解析执行计划,给出优化建议
- ArkClaw:整合所有信息,自动生成根因分析报告
- 业务效果:
- 之前:DBA 人工排查需要几个小时。
- 之后:几分钟自动输出诊断报告和优化建议,故障发现从小时级降到分钟级,平均查询性能提升 30%,运维成本降低 50%。
场景四:企业知识库 — 混合检索问答
- 业务场景:企业知识库搜索,关键词不准确,语义相似内容找不到。
- 联动方案:ByteHouse(存储计算) + ArkClaw(编排) + 混合检索 Skill
- 业务效果:
- BM25 关键词 + 向量语义双路召回,搜索准确率提升 35%,问题解决效率提升 60%,客户咨询人工成本降低 45%。
场景五:大数据企业 — 多模态舆情监控
- 业务场景:海量媒体数据(文本/图片/视频)检索,传统方案时延高、准确率差。
- 联动方案:ByteHouse(存储计算)+ ArkClaw(编排) + 混合检索 Skill + 多模态检索 Skill
- 业务效果:
- 原生支持多类型混合检索,百亿向量多条件毫秒级返回,查询性能提升 5-30x,召回准确率达到 90%,工程复杂度大幅降低。
常见问题
Q:使用 ByteHouse Skills 的前提条件是什么?
- A:客户需要先开通 ByteHouse 云服务,并配置好连接信息(HOST、PORT、USER、PASSWORD),如果使用检索功能还需要开通火山方舟 API Key 用于向量化。
Q:ByteHouse Skills 如何接入 ArkClaw(企业版)?
- A:ByteHouse Skills 安装方便,在ArkClaw对话框通过自然语言对话 检索和安装即可;
Q:运行一个 ByteHouse Skills 的 Demo 大概需要多久?
- A:如果客户已有 ByteHouse 账号和火山方舟 API Key,熟悉操作的情况下,跑通一个小 Demo(比如混合检索)约 2-3 分钟即可完成。
Q:客户测试 ByteHouse Skills 需要申请白名单吗?
- A:当前阶段不需要。客户可以直接开通 ByteHouse、配置 API Key 并安装所需 Skill,即可进行测试和使用。
Q:ByteHouse Skills 如何计费?是免费的吗?
- A:ByteHouse Skills 本身目前暂不独立计费,鼓励客户快速落地与试用。但调用 Skills 会消耗底层的 ByteHouse 计算存储资源和方舟向量化资源,这部分资源的计费方式与火山引擎官网刊例价保持一致。
Q:ByteHouse Skills 与第三方提供的同类能力(如第三方混合检索)相比,优势是什么?
- A:我们的优势主要体现在两方面:一是依托ByteHouse 原生向量索引,在性能和准确率上更有保障,比传统方案快 5-10x;二是火山原生深度整合,从连接到检索全链路优化,集成更顺畅,稳定性更好。
Q:ByteHouse Skills 目前提供了哪些核心能力?
- A:已上线七大核心技能,覆盖MCP连接、混合检索、多模态检索、数据资产分析、集群诊断、负载分析、慢查询优化,覆盖从数据管理到分析到运维全场景。