向量数据库VikingDB
本节将介绍如何基于已创建的知识库进行在线检索。知识检索适用于多种场景,包括文本查重、打标分类等。
说明
在知识检索界面,您可以提出您要检索的问题,系统会返回与问题最相关的若干个文本片段:
左侧为知识检索测试的参数设置,右侧为知识检索的界面。下表为各个参数的详细信息:
参数 | 作用 | 取值范围 |
|---|---|---|
返回文本片数量 | 控制最终检索返回的文本片数量。 | 如果没有打开重排模型:[1, 200] |
启用重排模型 | 控制是否使用重排模型对检索到的文本片进行重新排序。 | base-multilingual-rerank:速度快、长文本、支持70+种语言(默认) |
召回数量(Top K) | 召回是指从海量的候选文本片中找出与问题最相关的 K 个文本片的过程。仅在打开了重排模型的时候可设置此项。建议设置召回数量略大于返回文本片数量,可提高生成准确性。 | [1, 200] |
更多参数-Dense Weight | 在创建知识库时,如果选择的向量化模型和索引算法支持混合检索,则检索时系统会同时考虑问题与候选文本片的语义相关性和字面上的匹配程度,获得更准确的检索结果。 | [0.2, 1] |
更多参数-按标签过滤文档范围 | 标签过滤文档范围未配置时,表示不做过滤。 | -- |