存储成本高:业务涉及海量数据,存储占用过多。
计算资源消耗大:索引构建、查询、检索消耗大量计算资源。
多租户数据管理:希望在一个数据库中高效支持多个业务或客户,避免数据冗余。
量化方式 | 描述 | 场景 |
|---|---|---|
int8 | 将4字节的 float 压缩为单个字节,以获取内存和计算延迟的收益,会造成微小的损失精度,比如 cosine 距离会出现大于1的分值。 | 适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、consine。 |
float | 全精度,未做压缩量化。 | 适用于hnsw、hnsw_hybrid、flat、diskann索引算法,距离方式为ip、l2、consine。 |
fix16 | 将4字节的 float 压缩为两个字节,以获取内存和计算延迟的收益,会造成微小的损失精度。通过损失一定的检索精度,提升检索性能,节约资源成本。 | 适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、l2、consine。 |
pq | 将高维向量转换为低维码本向量,以减少内存占用并提高搜索效率。 | 适用于diskann、ivf索引算法,距离方式为ip、l2、consine。 |