本文介绍表征方式,如何根据自己的数据和检索需求,选择合适的表征方式。
表征方式是什么?
表征方式的含义
在向量检索的场景下,“表征方式”指的是:系统选择用指定的数据结构来描述一条内容(文本、图片或多模态片段),并据此决定检索时采用特定的匹配逻辑与索引组织形式。
目前向量库支持以下表征方式:
表征方式 | 介绍 | 优势 | 使用场景 |
|---|
稠密向量
Dense vector | 稠密向量是高维向量,每个维度都有非零值,通常从文本、图像或其他数据中提取语义特征。例如:v = [1.2, 3.4, 5.6, -0.5] | - 语义召回强:能搜到“意思相近但字不一样”的内容
- 多模态天然适配:图片、音频、文本都能统一到同一空间
- 易于做统一的 TopK 检索
| 需要强语义关联或跨模态统一检索的业务,是所有语义检索的基础。例如: - 知识库 / 问答系统的语义召回:适用于 “问法不同但核心语义一致” 的检索需求
- 多模态相似性检索
- 以图搜图:上传一张图片,检索图库中视觉语义相似的图片。
- 图文互搜:输入文本 “红色花瓣的玫瑰花”,检索对应的图片;或上传一张手机照片,检索描述该手机参数的文本。
- 视频检索:输入一段文本或一张图片,检索与图文内容语义相似的视频。
|
稀疏向量 Sparse vector | 稀疏向量是高维向量,其中大多数维度为零,基于显式的关键词表示。例如:{"什么":0.34, "是":0.76, "稀疏向量":0.98}
稀疏向量更接近“关键词—权重”的结构:绝大多数维度为零,只有少数与内容相关的词项被激活并携带权重。 | - 精确命中强:实体、专有名词、代码、数字、药品等,效果稳定
| 适合在语义检索时兼顾一定的关键词效果,用来配合稠密向量进行语义化检索,支持调整权重,例如: - 关键词依赖的专业领域检索:如医疗行业、法律 / 政务领域、代码 / 技术文档等,需要对特定专有名词进行匹配
- 混合检索的权重调节:通过调整两种向量的权重,平衡 “语义相关性” 和 “关键词精准度”。
|
张量 Tensor | 张量在向量检索中是二维向量数组,能承载比单维向量更丰富的维度信息,是处理复杂精细数据的核心表征形式。例如:[[0.1,0.2,0.3],...,[0.4,0.5,0.6]] | - 丰富语义:在检索中可描述更丰富的语义或多模态特征。
- 定位细节:对长文、细节问答、精确定位更友好
| 需要细粒度精准匹配、低时延重排,或高并发下控制 Rerank 模型 token 成本的业务,是提升检索效果的进阶选型,会使用在语义检索后的重排环节,利用张量信息完成超低时延的重排,得到更好效果,例如: - 文本细粒度精准检索:长文档 QA、法规 / 医疗指南的细节证据匹配,支持多条件约束查询,减少语义相似的误召回。
- 多模态局部特征对齐:图像区域与文本短语精准匹配,如定位图片特定位置的物体。
- 低时延图 / 视频搜索重排:适配低延时响应的图搜、视频检索场景,兼顾效果与性能,覆盖传统重排无法触达的性能敏感客户。
- 高并发文本检索降本:知识库、记忆库等高并发场景,替代需持续付费的实时重排,通过一次性离线处理降低长期使用成本。
|
表征方式的最佳实践
基于上述表征方式的说明,我们总结了通常使用最多的表征方式场景,以下针对表征方式的最佳实践供参考:
1 稀疏稠密向量混合检索
1.1 适用场景
稀疏稠密向量混合检索的核心适用场景,是需要同时兼顾 “语义相关性” 和 “关键词精准性”,单一向量检索无法满足需求的业务场景。例如:
- 关键词依赖的专业领域检索:如医疗行业、法律 / 政务领域、代码 / 技术文档或产品 / 物料型号等,需要对特定专有名词进行匹配。
- 主题依赖的内容检索:用户搜索可能是事件的语义化描述,也可能是事件中的核心实体。混合检索可同时匹配语义相关的新闻,以及包含精准实体关键词的内容,提升检索结果的全面性。
1.2 流程及原理

稠密稀疏混合近邻检索是结合稠密向量和稀疏向量的检索方法,可以同时利用稠密向量的语义匹配能力和稀疏向量的关键词匹配能力。稠密向量适用于捕获语义理解的隐含关系,但缺乏查找特定关键词或短语的能力;而稀疏向量则具备较强可解释性,能够捕获关键词的明确存在和缺失,但难以捕捉语义信息。
因此采用稠密稀疏向量混合检索以提高搜索结果的准确性和覆盖面,同时可以通过调整两种向量的权重,平衡 “语义相关性” 和 “关键词精准度”。
1.3 如何进行稠密稀疏向量混合检索
- 数据集创建:
- 若已有向量数据:需配置稀疏向量;
- 若从向量化开始:选择需要进行关键词或短语约束的字段进行稀疏向量表征配置。
- 检索测试:在结果配置环节调整 Dense Weight 值来指定检索时 dense 和 sparse 的权重。取值越大越侧重于稠密向量检索。详细操作参考:向量库新版本(V2)快速入门

- API参考:
- 若已有向量数据:向量检索-SearchByVector
- 若从向量化开始:多模态检索-SearchByMultiModal
2 向量检索+张量重排
2.1 适用场景
张量重排适用于需要兼顾细粒度精准匹配、低时延响应和高并发成本控制的检索场景,例如:
- 低时延要求的的图/视频搜索(响应要求低于 300ms):在此类场景中,推荐使用张量重排。与 Rerank 模型相比,可通过较少的时延带来效果收益。
- 高并发要求的文本搜索(关注 token 成本):在高并发场景下,使用模型重排会因 token 消耗而产生高昂费用。此时,改用张量重排是更经济的选择。尽管会增加少量计算资源开销,但相比于模型 tokens 的费用更少。
2.2 流程及原理

张量重排是在向量初步召回后针对召回结果进行的二次排序,是一种兼顾效果与效率的检索增强手段:其核心是将全交互中“查询与文本逐token交互”的环节前置,通过调整为分别编码为token级的多向量,仅在检索时计算query与库中数据之间的 maxsim ,以达到介于全交互和无交互之间的效果与延迟的效果和效率的平衡。
使用张量需要预先投入计算和存储资源,以换取检索时更低的开销。仅需一次向量化和交互计算。通过结合量化聚类、调节召回量等优化手段,其效果能够超越 rerank 模型,且耗时更低。
.3 如何进行张量重排
- 数据集创建:
- 若已有向量数据:需配置张量(Tensor);
- 若从向量化开始:需配置张量(Tensor)表征,张量表征的字段和所用模型需要与稠密向量表征的字段一致
- 检索测试:前端开启重排功能后,选择张量重排并配置进入重排的数据数量。详细操作参考:向量库新版本(V2)快速入门

- API参考:
- 若已有向量数据:向量检索-SearchByVector
- 若从向量化开始:多模态检索-SearchByMultiModal