You need to enable JavaScript to run this app.
导航
知识库
最近更新时间:2025.08.05 11:00:07首次发布时间:2025.08.05 11:00:07
复制全文
我的收藏
有用
有用
无用
无用

ByteHouse 知识库功能可支持您上传专属知识库,提供知识构建、管理与智能应用全流程能力,并通过细粒度权限管理保障数据安全,适用于企业业务知识管理、智能问答支持等场景。本文将详细介绍知识库的创建、文档上传、召回测试、权限管理及智能助手配置等操作流程。

功能概述

ByteHouse 知识库是专为企业打造的知识管理功能,可整合存储业务与行业知识,通过向量化处理、语义检索及 QA 生成实现高效知识使用,并支持权限管控与效果评估。核心能力如下:

  • 企业业务知识管理:ByteHouse 基于官方文档构建了默认知识库,同时也支持您上传和管理企业专属的业务及行业知识,提供文档向量化存储、语义检索、QA 问答自动生成等核心功能;知识导入后,还可进行启用/禁用等基础管理,以及重新分段、新增段落等精细化知识分段操作,助力知识高效沉淀与便捷调用。
  • 召回测试:可对已上传知识进行召回测试,直观评估知识库对相关信息的覆盖能力与检索效果,辅助优化知识管理策略。
  • 权限管理:提供细粒度权限控制,支持为用户或角色配置知识库的创建、查看、管理等权限,保障知识数据的安全可控。

使用限制

该功能为 Beta 功能,如需使用,请提交工单或联系 ByteHouse 团队获取白名单权限。

准备工作

准备好您需要上传的知识数据,当前 ByteHouse 支持上传 .md 格式的文档,单份文件大小不超过 200 MB。

快速上手:创建并导入知识库

步骤一:创建知识库

  1. 登录 ByteHouse 云数仓版控制台,单击顶部诊断分析页签,单击知识库,进入知识库管理界面。
    Image
  2. 单击**+知识库按钮,创建知识库,在新建知识库对话框中,填写知识库名称、描述信息,选择知识解析模型,单击创建**。系统将创建并启用该知识库。
    Image
    • 知识解析模型即 Embedding model,将自然语言转化为向量,用于语义检索和 QA 问答生成。
  3. 界面显示“创建知识库成功”后,您可在知识库管理界面查看已创建的知识库。

步骤二:导入知识

  1. 单击知识库卡片,进入详情页面,单击文档上传按钮,上传文档。
    Image

  2. 单击**+加号上传文档,按需选择分段方式,并单击确定**。系统将按照配置要求上传文档并对文档进行分段处理。
    Image
    分段方式指将上传的文档分割成不同片段的方法,合理的分段方式有助于提高知识库对文档内容的管理和检索效率,便于后续根据您的需求快速定位和获取相关内容。ByteHouse 当前支持按标题层级和按文本块大小两种方式分段。具体方式说明如下:

    分段方式

    分段说明

    按标题层级

    即根据文档的标题结构进行分段,适用于具有清晰标题体系(如多级标题、章节划分)的文档,常见使用场景包括结构化文档、需要保留内容上下文关联、按章节检索或复用文档结构等。
    分段层级用于指定分段依据的标题级别(如一级标题、二级标题)。系统将根据所选层级的标题自动分割文档,每个片段包含该标题下的完整内容。例如分段层级选择“三级标题”,则文档将按所有三级标题拆分为多个独立片段。

    按文本块大小

    根据设定的文本长度将文档切割为多个大致等长的独立文本块,适用于无明确标题结构或需精准关键词匹配的文档,常见场景包括非结构化文档、需要高频匹配短关键词、需控制片段长度的超长篇文档等。

    • 建议文本块大小:可根据您的需要设置文本长度值,该值决定了每个分段后的文本块大概包含多少字符或字节数。例如设置为 1000 字节,系统会尽量按此长度分割文档,具体长度可能会因文档内容的实际情况略有差异。
    • 分段标识符:指在按文本块大小分段时,用于标识文本块边界的符号或字符组合。系统在遇到标识符时,将其前后内容划分为不同片段。例如,如果您使用 \n\n 作为分段标识符,则文档中所有 \n\n 将作为片段的分割点。

    注意

    • 您可以选择当前推荐参数直接分段,或自定义参数后进行分段。后续可随时重新配置分段,上传的原文件将为您保留 5 天,之后文档将无法重新分段。
    • 当前 ByteHouse 支持的最大分段数为 4096。如果您选择的分段方式导致分段数超过 4096,系统将解析失败,并提示报错。您可单击重试,重新为文档分段。报错示意如下:
      Image
  3. 解析完成后,您可在文档列表中查看到该文档,且解析状态为“已完成”。如果您的文档较大,系统需要较长时间处理,请耐心等待。如果解析失败,系统将提供失败原因,您可根据失败原因采取相应处理措施。
    Image

  4. 您可单击文档名称,查看分段详情。如果当前分段内容不符合您的需求,您可为知识重新分段新增段落

步骤三:召回测试

在 ByteHouse 中,召回测试是针对上传至知识库的文档内容,评估系统从文档集合中准确找回所有与用户查询相关片段的性能测试,用于验证 ByteHouse 是否能从已上传的文档中尽可能全面地提取与关键词相关的文本片段,避免遗漏关键信息。
操作步骤

  1. 在知识库详情页面,单击召回测试,进入测试页面。
  2. 在关键词编辑框中输入需测试的关键词,单击测试
  3. 系统将根据您输入的关键词召回相关段落,您可查看对应的片段及召回率。召回率数值越高,说明系统遗漏的相关信息越少。如果召回率较低,您可参考重新分段中的操作,重新为知识分段。
    Image

步骤四:为智能助手选择知识库

知识库创建完成后默认启用,智能助手将读取您创建的知识库,您可按需选择并关联知识库,帮助您更好地结合业务需求使用 ByteHouse。
您可单击智能助手,单击聊天框左下角的知识库按钮,勾选需要的知识库,即可生效。
Image

后续操作:使用智能助手

知识库创建完成并为智能助手选择了所需的知识库后,您可使用智能助手进行智能问答、日志检索等功能,操作详情请参见以下文档:

管理知识库

ByteHouse 支持对知识库进行基础管理(如启用/禁用知识库、编辑名称与描述),以及精细化的知识分段管理(包括重新分段、新增段落、单个分段的管理等操作)。

启用/禁用知识库

知识库创建后默认启用,如需禁用某个知识库,您可将鼠标悬浮在知识库卡片上,单击禁用按钮,系统将临时停用该知识库,且不可关联至智能助手。
如需重新启用该知识库,您可单击启用按钮。启用后,您可以在智能助手页面选择该知识库并使用该知识库内容解答业务问题。
Image

编辑知识库

如需修改知识库名称和描述,可将鼠标悬浮在知识库卡片上,单击编辑按钮,修改知识库名称、描述,并单击保存

启用 /禁用文档

上传至知识库的文档默认启用,如需禁用某份文档,可以单击启用状态栏的禁用按钮,系统将临时停用该文档,调用知识库时将不使用该文档内容。
如需重新启用该文档,您可单击启用状态栏的启用按钮。启用后,使用当前文档所在的知识库时,可调用该文档内容。
Image

管理知识分段

重新分段

如果当前分段内容不符合您的需求,可单击重新分段,重新选择分段方式,并单击确定,系统将重新分段。
Image

新增段落

如果您需要在现有分段中添加新的段落,可单击新增段落,在编辑框中输入内容,并单击保存,系统将生成新分段。
Image

管理单个分段

您可将鼠标悬浮在分段上方,单击对应按钮,按需管理分段:
Image

  • 禁用/启用分段:分段完成后默认启用,如需禁用某个分段,可单击禁用按钮,并单击确定,即可禁用当前分段,禁用后,该分段内容将无法被使用。如需重新启用该分段,可单击启用按钮。启用后,使用分段所在的文档时,可调用该分段内容。
  • 段落预览:单击段落预览按钮,查看当前分段详情。
  • 编辑分段:单击编辑按钮,修改当前分段内容,修改后单击保存即可生效。
  • 删除分段:将鼠标悬浮在分段上方,单击删除按钮,并单击确定,即可删除当前分段。

管理知识库用户权限

ByteHouse 支持为用户授予知识库权限。

  • 具有 SystemAdmin 或 AccountAdmin 角色的用户可通过为用户授予角色或直接授予资源权限的方式,为某位用户授予/撤销知识库权限,该权限包括全部知识库的创建、查看、管理权限。
  • 其他角色的用户默认无知识库权限,如果该类用户需要在智能助手中使用知识库功能,需先为该用户授予知识库权限。

您可在知识库管理界面单击权限管理,系统将跳转至对应界面。
Image
操作详情请参见以下文档: