You need to enable JavaScript to run this app.
向量数据库VikingDB

向量数据库VikingDB

复制全文
最佳实践
【向量库】表征方式配置参考
复制全文
【向量库】表征方式配置参考

本文介绍表征方式,如何根据自己的数据和检索需求,选择合适的表征方式。

表征方式是什么?

表征方式的含义
在向量检索的场景下,“表征方式”指的是:系统选择用指定的数据结构来描述一条内容(文本、图片或多模态片段),并据此决定检索时采用特定的匹配逻辑与索引组织形式。
目前向量库支持以下表征方式:

表征方式

介绍

优势

使用场景

稠密向量
Dense vector

稠密向量是高维向量,每个维度都有非零值,通常从文本、图像或其他数据中提取语义特征。例如:v = [1.2, 3.4, 5.6, -0.5]

  • 语义召回强:能搜到“意思相近但字不一样”的内容
  • 多模态天然适配:图片、音频、文本都能统一到同一空间
  • 易于做统一的 TopK 检索

需要强语义关联跨模态统一检索的业务,是所有语义检索的基础。例如:

  1. 知识库 / 问答系统的语义召回:​适用于 “问法不同但核心语义一致” 的检索需求
  2. 多模态相似性检索
    • 以图搜图:上传一张图片,检索图库中视觉语义相似的图片。
    • 图文互搜:输入文本 “红色花瓣的玫瑰花”,检索对应的图片;或上传一张手机照片,检索描述该手机参数的文本。
    • 视频检索:输入一段文本或一张图片,检索与图文内容语义相似的视频。

稀疏向量 Sparse vector

稀疏向量是高维向量,其中大多数维度为零,基于显式的关键词表示。例如:{"什么":0.34, "是":0.76, "稀疏向量":0.98}
稀疏向量更接近“关键词—权重”的结构:绝大多数维度为零,只有少数与内容相关的词项被激活并携带权重。

  • 精确命中强:实体、专有名词、代码、数字、药品等,效果稳定

适合在语义检索时兼顾一定的关键词效果,用来配合稠密向量进行语义化检索,支持调整权重,例如:

  1. 关键词依赖的专业领域检索:​如医疗行业、法律 / 政务领域、代码 / 技术文档等,需要对特定专有名词进行匹配
  2. 混合检索的权重调节:​通过调整两种向量的权重,平衡 “语义相关性” 和 “关键词精准度”。

张量 Tensor

张量在向量检索中是二维向量数组,能承载比单维向量更丰富的维度信息,是处理复杂精细数据的核心表征形式。例如:[[0.1,0.2,0.3],...,[0.4,0.5,0.6]]

  • 丰富语义:在检索中可描述更丰富的语义或多模态特征。
  • 定位细节:对长文、细节问答、精确定位更友好

需要细粒度精准匹配低时延重排,或高并发下控制 Rerank 模型 token 成本的业务,是提升检索效果的进阶选型,会使用在语义检索后的重排环节,利用张量信息完成超低时延的重排,得到更好效果,例如:

  1. 文本细粒度精准检索:长文档 QA、法规 / 医疗指南的细节证据匹配,支持多条件约束查询,减少语义相似的误召回。
  2. 多模态局部特征对齐:图像区域与文本短语精准匹配,如定位图片特定位置的物体。
  3. 低时延图 / 视频搜索重排:适配低延时响应的图搜、视频检索场景,兼顾效果与性能,覆盖传统重排无法触达的性能敏感客户。
  4. 高并发文本检索降本:知识库、记忆库等高并发场景,替代需持续付费的实时重排,通过一次性离线处理降低长期使用成本。

表征方式的最佳实践

基于上述表征方式的说明,我们总结了通常使用最多的表征方式场景,​以下针对表征方式的最佳实践供参考:

1 稀疏稠密向量混合检索

1.1 适用场景

稀疏稠密向量混合检索的核心适用场景,是需要同时兼顾 “语义相关性” 和 “关键词精准性”,单一向量检索无法满足需求的业务场景。例如:

  1. 关键词依赖的专业领域检索:​如医疗行业、法律 / 政务领域、代码 / 技术文档或产品 / 物料型号等,需要对特定专有名词进行匹配。
  • 主题依赖的内容检索:​用户搜索可能是事件的语义化描述,也可能是事件中的核心实体。​混合检索可同时匹配语义相关的新闻,以及包含精准实体关键词的内容,提升检索结果的全面性。

1.2 流程及原理

Image
稠密稀疏混合近邻检索是结合稠密向量和稀疏向量的检索方法,可以同时利用稠密向量的语义匹配能力稀疏向量的关键词匹配能力。稠密向量适用于捕获语义理解的隐含关系,但缺乏查找特定关键词或短语的能力;而稀疏向量则具备较强可解释性,能够捕获关键词的明确存在和缺失,但难以捕捉语义信息。
因此采用稠密稀疏向量混合检索以提高搜索结果的准确性和覆盖面,同时可以通过调整两种向量的权重,平衡 “语义相关性” 和 “关键词精准度”。

1.3 如何进行稠密稀疏向量混合检索

  1. 数据集创建:
    1. 若已有向量数据:​需配置稀疏向量;
    2. 若从向量化开始:​选择需要进行关键词或短语约束的字段进行稀疏向量表征配置。
  2. 检索测试:​在结果配置环节调整 Dense Weight 值来指定检索时 dense 和 sparse 的权重。取值越大越侧重于稠密向量检索。详细操作参考:向量库新版本(V2)快速入门

Image

  1. API参考:
    1. 若已有向量数据:向量检索-SearchByVector
    2. 若从向量化开始:多模态检索-SearchByMultiModal

2 向量检索+张量重排

2.1 适用场景

张量重排适用于需要兼顾细粒度精准匹配、低时延响应和高并发成本控制的检索场景,例如:

  • 低时延要求的的图/视频搜索(响应要求低于 300ms):在此类场景中,推荐使用张量重排。与 Rerank 模型相比,可通过较少的时延带来效果收益。
  • 高并发要求的文本搜索(关注 token 成本):在高并发场景下,使用模型重排会因 token 消耗而产生高昂费用。此时,改用张量重排是更经济的选择。尽管会增加少量计算资源开销,但相比于模型 tokens 的费用更少。

2.2 流程及原理

Image
张量重排是在向量初步召回后针对召回结果进行的二次排序,是一种兼顾效果与效率的检索增强手段:其核心是将全交互中“查询与文本逐token交互”的环节前置,通过调整为分别编码为token级的多向量,仅在检索时计算query与库中数据之间的 maxsim ,以达到介于全交互和无交互之间的效果与延迟的效果和效率的平衡。
使用张量需要预先投入计算和存储资源,以换取检索时更低的开销。仅需一次向量化和交互计算。通过结合量化聚类、调节召回量等优化手段,其效果能够超越 rerank 模型,且耗时更低。

.3 如何进行张量重排

  1. 数据集创建:
    1. 若已有向量数据:​需配置张量(Tensor)
    2. 若从向量化开始:​需配置张量(Tensor)表征,​张量表征的字段和所用模型需要与稠密向量表征的字段一致
  2. 检索测试:前端开启重排功能后,选择张量重排并配置进入重排的数据数量。​详细操作参考:向量库新版本(V2)快速入门

Image

  1. API参考:
    1. 若已有向量数据:向量检索-SearchByVector
    2. 若从向量化开始:多模态检索-SearchByMultiModal
最近更新时间:2026.01.27 21:10:02
这个页面对您有帮助吗?
有用
有用
无用
无用