本页面用于介绍如何进行检索测试,按检索基于的数据集类型分为:向量检索、文本向量检索、多模态向量检索
向量检索是一种基于向量空间模型的检索方法,通过计算向量之间的相似度进行检索。在一个给定向量数据集中,向量检索按照某种度量方式(比如内积、欧式距离),对向量构建的一种时间和空间上比较高效的数据结构,能够高效地检索出与目标向量相似的 K 个向量。
注意
当索引的执行状态为已就绪 时,才支持操作检索测试;当索引的执行状态为初始化中 、失败 时,不支持操作检索测试。
操作步骤
检索测试 页面有三种进入方式:
方式一:在左侧导航栏单击索引 ,进入索引页面。单击索引列表指定索引操作列的检索测试 ,进入检索测试页面。 方式二:在左侧导航栏单击索引 ,进入索引页面。单击索引列表指定索引的名称,进入索引详情页面,单击检索测试 页签。 方式三:在左侧导航栏单击数据集 ,进入数据查询页面。在数据预览的操作栏中单击检索测试,进入检索测试页面。 在检索测试 页面,输入**检索对象,**按数据集的类型不同输入的检索对象也有所不同
如果数据集中的向量化字段为vector类型 ,检索类型为向量检索 ,输入检索对象为向量
如果数据集中的向量化字段为text类型 ,检索类型为文本向量检索 ,输入检索对象为文本
如果数据集中的向量化字段包含image类型 ,检索类型为多模态向量检索 ,输入检索对象为文本或图片
(可选)配置检索参数 各参数的解释如下:
参数
解释
默认值
限制(Top-k)
返回结果的数量
100
Dense Weight
混合检索中稠密向量的权重,1 表示纯稠密检 只有索引是**混合索引(hnsw_hybrid)**时有效。范围 [0.2, 1] 0.5
子索引
在特定子索引中进行检索
无
检索精度控制
用于控制检索延时和精度,调升参数值会提高召回率,但会相对降低检索性能。
5.00
输出字段
选择检索结果展示的字段
展示所有字段
(可选)设置标量过滤和主键过滤条件
配置标量过滤条件后,在检索时使用向量检索来匹配向量的相似度,同时使用标量检索来匹配向量的标量值。详细的标量过滤算子参考标量过滤 通过主键过滤能力在向量数据库中通过主键限定结果范围。详细参考主键过滤 (可选)设置后置处理方式 用于在向量召回 之后,对候选数据进行进一步的过滤和优化,确保最终返回的搜索结果更加精准、高效。目前控制台支持关键词匹配 和频率控制 两种后置处理方式。详细的后置处理方法参考后置处理
查询结果,点击下方查询按钮可以查看检索结果
对于向量检索 ,表示按照输入的查询向量检索出相似的 K 个向量,查询结果默认按照 score 从高到低排序。 对于文本向量检索 ,会根据使用文本向量化模型对查询文本进行向量化,并检索出相似的 K 条结果。 对于多模态向量检索 ,会根据使用图文向量化模型对查询**图片、文本或图+文 **对进行向量化,并检索出相似的 K 条结果。