基础信息 | 名称 | 指定创建的知识库名称。必填。 - 只能使用英文字母、数字、下划线_,并以英文字母开头,不能为空。
- 长度要求:[1, 64]。
- 知识库名称不能重复。
|
描述 | 自定义知识库的描述。选填。 |
知识库配置 | 切片方式 | 仅支持默认切片方式。分别解析出文档中的各种元素(如标题、章节标题、章节内容、目录等),并跟进向量化模型的输入token限制进行切分。 |
向量化模型 | 可选文本向量模型(高精度版)、文本向量模型(多功能版)。必填。
各个向量化模型的特点和使用建议: - 文本向量化模型(高精度版)+文本向量化模型(多功能版)——基于语言模型抽取字面匹配特征及语义特征,检索时兼顾两者,能带来最好的检索效果。模型会分别使用最高质量的向量化模型产出稠密向量和稀疏向量,分别适用于语义检索和关键词检索。这个模型在关注语义相似性的同时兼顾字面上的匹配,带来更优的检索效果。
- 文本向量化模型(多功能版)——支持 8k Token 的长输入窗口,同时也支持多语言检索和跨语言检索。模型会产出稠密向量和稀疏向量,分别适用于语义检索和关键词检索。这个模型在关注语义相似性的同时兼顾字面上的匹配,带来更优的检索效果。
- 文本向量化模型(高精度版)——支持中文,在纯语义检索中能带来较好的检索效果。
|
字段配置 | 单击字段列表下「添加字段」按钮,添加自定义字段,此处的字段配置可用于在线检索的filter。。非必填(可不配置字段)。 - 字段名称:填写字段名称,名称只能使用英文字母、数字、下划线_,并以英文字母开头,不能为空,且名称不能重复,长度要求为 [1, 128]。必填。
- 字段类型:在下拉列表选择字段类型,可选值:string、bool、list<string>、list<int64>、int64、float32。必填。
- 默认值:若导入文档的元数据中该字段无值,会使用默认值填充。只能使用英文字母、数字、下划线_,并以英文字母开头。非必填。
- 删除:单击可以删除字段。
|
CPU | 索引检索消耗的CPU配额,1CPU 核约为 100QPS;如果检索消耗的CPU超过配额,该索引会被限流,格式为正整数。必填。 |
索引算法 | 索引算法,默认HNSW-Hybrid,枚举值:HNSW-Hybrid、HNSW、FLAT。必选。 - HNSW:全称是 Hierarchical Navigable Small World,一种用于在高维空间中采用 ANN 搜索的数据结构和算法,是基于图的索引。HNSW通过构建多层网络减少搜索过程中需要访问的节点数量,实现快速高效地搜索最近邻,适用于大规模数据集,对检索性能要求高的场景
- HNSW-Hybrid:支持混合索引的 HNSW 算法。混合索引算法可以同时对数据集中的稠密向量和稀疏向量进行索引,并在检索时返回兼顾两种类型相似性的结果。适用于对搜索效率要求较高,且需要同时检索稀疏和稠密向量的场景。
- FLAT:暴力索引,搜索时遍历整个向量数据库的所有向量与目标向量进行距离计算和比较,查询速度较慢,但是 FLAT 能提供100%的检索召回率,适用于小规模数据集,对检索精度要求高的场景。
不同的向量化模型有着不同的索引算法配置: - 文本向量化模型(高精度版):支持HNSW、FLAT
- 文本向量化模型(多功能版):支持HNSW-Hybrid、HNSW、FLAT
- 文本向量化模型(高精度版)+文本向量化模型(多功能版):仅支持HNSW-Hybrid
注意 文本向量化模型(多功能版)会同时产出稠密向量和稀疏向量,分别适用于语义检索和关键词检索。默认的HNSW-Hybrid算法可以兼顾稠密向量和稀疏向量,在关注语义相似性的同时兼顾字面上的匹配,带来更优的检索效果。
您也可以使用HNSW或FLAT算法搭配文本向量化模型(多功能版)模型,此时索引只会索引模型产出的稠密向量,即只支持语义检索能力。 |
量化方式 | 量化方式。量化方式是索引中对向量的压缩方式,可以降低向量间相似性计算的复杂度。基于向量的高维度和大规模特点,采用向量量化可以有效减少向量的存储和计算成本。默认Int8,枚举值:Int8、Float、Fix16。必选。 - Int8:将4字节的 float 压缩为单个字节,以获取内存和计算延迟的收益,会造成微小的损失精度,比如 cosine 距离会出现大于1的分值。通过损失一定的检索精度,提升检索性能,节约资源成本。
- Float:全精度,未做压缩量化。
- Fix16:将4字节的 float 压缩为两个字节,以获取内存和计算延迟的收益,会造成微小的损失精度。通过损失一定的检索精度,提升检索性能,节约资源成本。
|