You need to enable JavaScript to run this app.
导航
提高精度
最近更新时间:2025.09.30 16:06:36首次发布时间:2025.09.30 16:06:36
复制全文
我的收藏
有用
有用
无用
无用

背景介绍

什么是检索精度?

检索精度指的是系统返回的查询结果与用户预期结果的匹配程度。在向量数据库中,优化精度主要涉及向量量化、模型选择、索引参数调整等方面。

哪些场景需要提高精度?

  • 高精准搜索:需要确保返回结果与查询向量的匹配度极高,例如医疗、金融等领域。
  • 小规模数据集:数据量较小,希望通过精确匹配获取最佳结果。
  • 复杂语义检索:涉及自然语言理解、图像识别等,需要更高的表达能力来匹配复杂查询需求。

优化方案

量化优化

采用 float 量化,保留更多信息,提高向量检索精度。

量化方式

描述

场景

int8

将4字节的 float 压缩为单个字节,以获取内存和计算延迟的收益,会造成微小的损失精度,比如 cosine 距离会出现大于1的分值。

适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、consine。

float

全精度,未做压缩量化。

适用于hnsw、hnsw_hybrid、flat、diskann索引算法,距离方式为ip、l2、consine。

fix16

将4字节的 float 压缩为两个字节,以获取内存和计算延迟的收益,会造成微小的损失精度。通过损失一定的检索精度,提升检索性能,节约资源成本。

适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、l2、consine。

pq

将高维向量转换为低维码本向量,以减少内存占用并提高搜索效率。

适用于diskann、ivf索引算法,距离方式为ip、l2、consine。

Embedding 模型优化

选择向量维度更大的模型,增加表示能力,提高检索匹配效果。

索引参数优化

调整索引参数,适当调大索引构建参数,以提高检索精度。
数据量较小时(≤50W 条),建议使用暴力索引(Brute Force),确保最高精度。

模型与向量化方式选择

根据业务场景选择最佳 embedding 模型与向量化方法,以获得最佳检索效果。

RAG(检索增强生成)场景优化

采用 dense + sparse 结合,提升查询结果的相关性和覆盖度。