ByteHouse 知识库功能可支持您上传专属知识库,提供知识构建、管理与智能应用全流程能力,并通过细粒度权限管理保障数据安全,适用于企业业务知识管理、智能问答支持等场景。本文将详细介绍知识库的创建、文档上传、召回测试、权限管理及智能助手配置等操作流程。
ByteHouse 知识库是专为企业打造的知识管理功能,可整合存储业务与行业知识,通过向量化处理、语义检索及 QA 生成实现高效知识使用,并支持权限管控与效果评估。核心能力如下:
该功能为 Beta 功能,如需使用,请提交工单或联系 ByteHouse 团队获取白名单权限。
准备好您需要上传的知识数据,当前 ByteHouse 支持上传 .md 格式的文档,单份文件大小不超过 200 MB。
单击知识库卡片,进入详情页面,单击文档上传按钮,上传文档。
单击**+加号上传文档,按需选择分段方式,并单击确定**。系统将按照配置要求上传文档并对文档进行分段处理。
分段方式指将上传的文档分割成不同片段的方法,合理的分段方式有助于提高知识库对文档内容的管理和检索效率,便于后续根据您的需求快速定位和获取相关内容。ByteHouse 当前支持按标题层级和按文本块大小两种方式分段。具体方式说明如下:
分段方式 | 分段说明 |
|---|---|
按标题层级 | 即根据文档的标题结构进行分段,适用于具有清晰标题体系(如多级标题、章节划分)的文档,常见使用场景包括结构化文档、需要保留内容上下文关联、按章节检索或复用文档结构等。 |
按文本块大小 | 根据设定的文本长度将文档切割为多个大致等长的独立文本块,适用于无明确标题结构或需精准关键词匹配的文档,常见场景包括非结构化文档、需要高频匹配短关键词、需控制片段长度的超长篇文档等。
|
注意
解析完成后,您可在文档列表中查看到该文档,且解析状态为“已完成”。如果您的文档较大,系统需要较长时间处理,请耐心等待。如果解析失败,系统将提供失败原因,您可根据失败原因采取相应处理措施。
在 ByteHouse 中,召回测试是针对上传至知识库的文档内容,评估系统从文档集合中准确找回所有与用户查询相关片段的性能测试,用于验证 ByteHouse 是否能从已上传的文档中尽可能全面地提取与关键词相关的文本片段,避免遗漏关键信息。
操作步骤:
知识库创建完成后默认启用,智能助手将读取您创建的知识库,您可按需选择并关联知识库,帮助您更好地结合业务需求使用 ByteHouse。
您可单击智能助手,单击聊天框左下角的知识库按钮,勾选需要的知识库,即可生效。
知识库创建完成并为智能助手选择了所需的知识库后,您可使用智能助手进行智能问答、日志检索等功能,操作详情请参见以下文档:
ByteHouse 支持对知识库进行基础管理(如启用/禁用知识库、编辑名称与描述),以及精细化的知识分段管理(包括重新分段、新增段落、单个分段的管理等操作)。
知识库创建后默认启用,如需禁用某个知识库,您可将鼠标悬浮在知识库卡片上,单击禁用按钮,系统将临时停用该知识库,且不可关联至智能助手。
如需重新启用该知识库,您可单击启用按钮。启用后,您可以在智能助手页面选择该知识库并使用该知识库内容解答业务问题。
如需修改知识库名称和描述,可将鼠标悬浮在知识库卡片上,单击编辑按钮,修改知识库名称、描述,并单击保存。
上传至知识库的文档默认启用,如需禁用某份文档,可以单击启用状态栏的禁用按钮,系统将临时停用该文档,调用知识库时将不使用该文档内容。
如需重新启用该文档,您可单击启用状态栏的启用按钮。启用后,使用当前文档所在的知识库时,可调用该文档内容。
如果当前分段内容不符合您的需求,可单击重新分段,重新选择分段方式,并单击确定,系统将重新分段。
如果您需要在现有分段中添加新的段落,可单击新增段落,在编辑框中输入内容,并单击保存,系统将生成新分段。
您可将鼠标悬浮在分段上方,单击对应按钮,按需管理分段:
ByteHouse 支持为用户授予知识库权限。
您可在知识库管理界面单击权限管理,系统将跳转至对应界面。
操作详情请参见以下文档: