You need to enable JavaScript to run this app.
文档中心
向量数据库VikingDB

向量数据库VikingDB

复制全文
下载 pdf
最佳实践
【向量库】计算资源配置参考
复制全文
下载 pdf
【向量库】计算资源配置参考

本文介绍创建索引时,如何根据自己的数据量和检索量需求,选择合适的CU资源数量。

1 什么是CU?

CU资源:CU是衡量计算资源的单位,在向量数据库中,1 CU 代表 1 核 CPU 和 8GB 内存。CPU越多,能够承载QPS(每秒查询量)更大,内存越多,能够存储的向量就越多;
CU的计算公式:CU = max(CPU, 内存/8),即根据实际内存和CPU的消耗取最大来作为所需的CU数量;
内存自动扩缩容:数据量变多时会导致内存超额,VikingDB将自动扩容,内存减少后也会自动缩容,最小为用户手动配置的CU配额(CPU自动扩容暂不支持,即当实际QPS超过CPU能力后,不会自动增加CPU数量)。

2 如何选择CU?

2.1 存储容量参考

  • CU 数量:不同 CU 规格的计算资源,包含 CPU 核数和内存大小;
  • 预估最大向量条数:在不同向量维度(1024 维 / 2048 维)、Int8量化、有标量字段的情况下,每个 CU 规格能存储的最大向量条数;

下方为参考示例:

CU数量

CPU数量

内存

预估最大向量条数
(1024维,Int8量化,有标量字段)

预估最大向量条数
(2048维,Int8量化,有标量字段)

1

1

8 GB

2,300,000

1,150,000

2

2

16 GB

4,600,000

2,300,000

4

4

32 GB

9,200,000

4,600,000

8

8

64 GB

18,400,000

9,200,000

16

16

128 GB

36,800,000

18,400,000

32

32

256 GB

73,600,000

36,800,000

64

64

512 GB

147,200,000

73,600,000

128

128

1024 GB

294,400,000

147,200,000

价格计算器使用说明

链接:https://console.volcengine.com/vikingdb/region:vikingdb+cn-beijing/bohr/price-calculator

价格计算器可基于你的数据与索引配置,输出三类核心预估结果:计算资源(CU)用量、存储资源(磁盘容量,单位 GB)、以及对应费用明细。
你可以通过两种方式打开计算器:

  • 固定入口:登录 VikingDB控制台后,在左侧导航栏直接点击 【价格计算器】进入

Image

  • 快捷入口:在创建索引页面,点击页面上的【价格计算器】按钮

Image

计算器为表单驱动模式,每次修改配置后系统会自动触发计算,实时更新右侧预估结果,需要填写的参数如下:

  • 向量类型:至少选择 1 类,支持多选,可选项包括稠密向量(Dense,最常用的 embedding 向量形式)、稀疏向量(Sparse,适用于稀疏特征 / 词袋场景)、张量(Tensor,适用于张量表征场景),选择后后续的索引类型、量化方式可选项会联动变化。
  • 维度配置
    • 若选择稠密向量,需填写稠密维度,范围为 128~4096,维度越高检索效果越好,但资源开销也越大
    • 若选择张量,需填写张量维度 n(范围 2~64)和张量维度 m(范围 4~2048),按张量实际 shape 填写即可
  • 索引类型与量化方式
    • 索引类型默认 HNSW,可选项会随向量类型变化,例如仅选择稠密向量时,可选 HNSW、DiskANN、FLAT 等
    • 量化方式默认 Float,还支持 Fix16、Int8等;若组合不兼容,系统会自动禁用不可选项并提示原因。
  • 数据量:填写预估写入的向量条数,单位为百万条,取值范围 1~10000(百万)。
  • 标量字段配置:若需要存储标题、标签等标量字段,可填写标量字段数,以及每个标量字段的平均长度,用于计算额外存储开销。

Image

填写完所有参数后,右侧会自动输出三类预估结果:

  1. CU 数量:即计算资源预估,受数据量、维度、索引和量化方式共同影响
  2. 磁盘大小:即存储资源预估,包含向量本体、索引结构及标量字段的总存储开销,单位为 GB
  3. 预估费用与明细:展示小时维度的预估费用,并拆分计算资源、存储资源等费用构成。

2.2 检索性能参考

  • CU 数量:不同 CU 规格的计算资源,包含 CPU 核数和内存大小;
  • 预估最大QPS:在不同数量的768维向量、Int8量化、有标量字段、默认索引参数情况下,每个 CU 规格能支持的最大每秒查询量;

下方为参考示例:

CU量

CPU数量

内存

预估最大QPS
(100万条向量,768维,Int8量化,有标量字段)

1

1

8 GB

642

8

8

64 GB

3370

CU量

CPU数量

内存

预估最大QPS
(1亿条向量,768维,Int8量化,有标量字段)

32

32

256

4562

64

64

512

9124

2.3 存储和性能的关系

需要注意的是,在固定的 CU 资源下,向量存储量与检索性能(QPS)往往此消彼长:当您存储的向量数量增加时,系统需要处理的数据规模也更大,查询速度可能会随之下降,无法达到理论最大性能。
因此,在规划向量数量和预期 QPS 时,要综合考虑业务需求和资源配比,找到数据存储与检索性能之间的平衡点。

最近更新时间:2026.04.16 22:28:35
这个页面对您有帮助吗?
有用
有用
无用
无用