You need to enable JavaScript to run this app.
导航

标量过滤检索

最近更新时间2024.04.16 13:11:52

首次发布时间2023.11.21 20:42:24

本页面用于介绍如何进行混合检索测试,可配置查询向量限制(Top-K)子索引标量过滤后查看混合检索结果。
混合检索是指在向量数据库中,同时使用向量检索和标量检索两种方法进行检索。在混合检索中,使用向量检索来匹配向量的相似度,同时可以使用标量检索来匹配数据的标量值进行过滤。

注意

  • 当索引的执行状态为已就绪时,才支持操作检索测试;当索引的执行状态为初始化中失败时,不支持操作检索测试。
  • 标量过滤参数配置时,表示混合检索;该参数未配置时,表示向量检索。本页面该参数需要配置。
  • 查询向量配置时,表示按照输入的查询向量检索出相似的 K 个向量;当查询向量未配置时,表示默认按照向量 [0,0,0,0......] 检索出相似的 K 个向量。

操作步骤
  1. 检索测试页面有两种进入方式:

    1. 方式一:在左侧导航栏单击索引,进入索引页面。单击索引列表指定索引操作列的检索测试,进入检索测试页面。
    2. 方式二:在左侧导航栏单击索引,进入索引页面。单击索引列表指定索引的名称,进入索引详情页面,单击检索测试页签。
  2. 检索测试页面,输入查询向量限制(Top-K)子索引标量过滤
    图片

    检索条件

    参数说明

    查询向量

    输入 JSON 数组字符串,向量维度为创建数据集时定义向量字段的维度。选填

    • 查询向量配置时,表示按照输入的查询向量检索出相似的 K 个向量。
    • 查询向量未配置时,表示默认按照向量 [0,0,0,0......] 检索出相似的 K 个向量

    限制(Top-K)

    输入 Top-K 值,默认100,表示检索返回多少个结果。必填

    子索引

    在下拉列表中选择子索引,即《新建索引》页面中子索引划分字段选择的字段名称所对应的字段值。必填

    • 子索引划分字段未设置时,则子索引下拉框默认为 default。
    • 适用场景:适用于将数据集划分为多个子数据集,在某个子数据集/子索引内部检索等检索模式固定的场景。比如,根据国家 ID 将数据集拆分,针对某个国家 ID 的子索引检索场景,无需对国家 ID 进行过滤,提升检索性能。

    标量过滤

    标量过滤条件,混合检索时必填。

    • 《新建索引》页面中过滤字段未设置时,表示不做过滤,检索测试阶段标量过滤没有可选择的字段名称。
    • 《新建索引》页面中过滤字段设置时,检索测试阶段在下拉列表中选择一个标量过滤字段名字,并选择对应的过滤条件。
    • 过滤条件包括六种:包含、不包含、大于、小于、大于等于、小于等于。条件关系包括两种:且、或。
  3. 单击左下角查询后可查看混合检索结果,查询结果默认按照 score 从高到低排序。
    图片