最近更新时间:2024.04.16 13:11:52
首次发布时间:2023.11.20 18:43:45
本页面用于介绍如何进行向量检索测试,可配置查询向量、限制(Top-K)、子索引后查看向量检索结果。
向量检索是一种基于向量空间模型的检索方法,通过计算向量之间的相似度进行检索。在一个给定向量数据集中,向量检索按照某种度量方式(比如内积、欧式距离),对向量构建的一种时间和空间上比较高效的数据结构,能够高效地检索出与目标向量相似的 K 个向量。
注意
绑定了 pipeline 的情况:
混合索引检索测试的情况:
纯稠密向量检索测试的情况:
检索条件 | 参数说明 |
---|---|
查询向量(对于没有绑定 pipeline 的索引) | 输入 JSON 数组字符串,向量维度为创建数据集时定义向量字段的维度。选填。
|
查询文本(对于绑定了 pipeline 的索引) | 输入纯文本进行检索。 |
限制(Top-K) | 输入 Top-K 值,默认100,表示检索返回多少个结果。必填。 |
Dense_weight | 仅混合索引会出现。用于调整混合索引中稠密向量的比重,范围为[0.2, 1], 越偏向 1 表示越注重语义检索,越偏向 0 表示越偏向于关键词检索。 |
子索引 | 在下拉列表中选择子索引,即《新建索引》页面中子索引划分字段选择的字段名称所对应的字段值。必填。
|
标量过滤 | 指定标量过滤条件,本页面该参数无需配置。
|
当查询向量配置时,表示按照输入的查询向量检索出相似的 K 个向量,查询结果默认按照 score 从高到低排序。
当查询向量未配置时,表示默认按照向量 [0,0,0,0......] 检索出相似的 K 个向量。
对于绑定了 pipeline 的文本,会根据使用的 pipeline 检索出相似的 K 条文本