You need to enable JavaScript to run this app.
导航
降低成本
最近更新时间:2025.09.30 16:06:36首次发布时间:2025.09.30 16:06:36
复制全文
我的收藏
有用
有用
无用
无用

常见场景

存储成本高:业务涉及海量数据,存储占用过多。
计算资源消耗大:索引构建、查询、检索消耗大量计算资源。
多租户数据管理:希望在一个数据库中高效支持多个业务或客户,避免数据冗余。

优化方案

Embedding 模型优化

  • 选择向量维度更小的模型,减少存储占用,同时提高检索速度。
  • 预期:
    • 降低存储需求,减少存储成本。
    • 提高索引加载速度,加快检索效率。
    • 可能会影响模型的表达能力,导致查询精度下降。
  • 例如:​doubao-embedding-large 模型通过 model_version 参数从 4096 维模型降为 2048 维,存储占用减少 50%,索引构建时间缩短。

量化优化

  • 采用 int8 量化,减少存储大小和计算开销,提高索引加载及查询性能。
  • 预期
    • 降低存储和计算成本,减少索引占用的内存。
    • 提高查询速度,减少计算资源消耗。

量化方式

描述

场景

int8

将4字节的 float 压缩为单个字节,以获取内存和计算延迟的收益,会造成微小的损失精度,比如 cosine 距离会出现大于1的分值。

适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、consine。

float

全精度,未做压缩量化。

适用于hnsw、hnsw_hybrid、flat、diskann索引算法,距离方式为ip、l2、consine。

fix16

将4字节的 float 压缩为两个字节,以获取内存和计算延迟的收益,会造成微小的损失精度。通过损失一定的检索精度,提升检索性能,节约资源成本。

适用于hnsw、hnsw_hybrid、flat索引算法,距离方式为ip、l2、consine。

pq

将高维向量转换为低维码本向量,以减少内存占用并提高搜索效率。

适用于diskann、ivf索引算法,距离方式为ip、l2、consine。

数据存储优化

  • 减少不必要的标量字段,优化存储结构,降低索引负担,提高查询效率。

索引管理优化

  • 按需加载索引
    • 不使用时先删除索引,减少开销。需要使用时再重新构建索引。
  • 预期
    • 降低存储成本,提高数据管理效率。
    • 避免多个租户数据重复存储,减少占用空间。

多租户数据管理

  • 通过单个数据集支持多租户业务,减少重复存储。
  • 预期
    • 降低存储成本,提高数据利用效率。
    • 避免多个租户数据重复存储,减少占用空间。
  • 例如:优化数据组织方式,提高检索效率,避免数据冗余。