【向量库】计算资源配置参考--向量数据库VikingDB-火山引擎

文档中心

向量数据库VikingDB

最佳实践

【向量库】计算资源配置参考

本文介绍创建索引时，如何根据自己的数据量和检索量需求，选择合适的CU资源数量。

1 什么是CU？

CU资源：CU是衡量计算资源的单位，在向量数据库中，1 CU 代表 1 核 CPU 和 8GB 内存。CPU越多，能够承载的QPS（每秒查询量）越大，内存越多，能够存储的向量就越多；
CU的计算公式：CU = max(CPU, 内存/8)，即根据实际内存和CPU的消耗取最大来作为所需的CU数量；
内存自动扩缩容：数据量变多时会导致内存超额，VikingDB将自动扩容，内存减少后也会自动缩容，最小为用户手动配置的CU配额（CPU自动扩容暂不支持，即当实际QPS超过CPU能力后，不会自动增加CPU数量）。

2 如何选择CU？

2.1 存储容量参考

CU 数量：不同 CU 规格的计算资源，包含 CPU 核数和内存大小；
预估最大向量条数：在不同向量维度（1024 维 / 2048 维）、Int8量化、有标量字段的情况下，每个 CU 规格能存储的最大向量条数；

说明

如何选择索引？
内存索引：HNSW最常用，适合向量维度中等、数据量在百万～上亿级，对延迟和 QPS 要求高的场景；HNSW-Hybrid在 HNSW 的基础上，同时索引稠密向量和稀疏向量，增加关键词信号；FLAT是全量暴力检索索引，查询速度相对较慢，但召回率最高，适用于候选集规模较小，数据量在几千～几万，对成本不敏感的场景。
磁盘索引：DiskANN适合大规模数据（亿级及以上）、且并发要求不高的场景。此索引将大部分数据存储在 SSD 上，仅将少量结构放入内存，可显著降低内存成本。

内存索引容量（HNSW、FLAT）

CU数量	CPU数量	内存	预估最大向量条数（1024维,Int8量化,有标量字段）	预估最大向量条数（2048维,Int8量化,有标量字段）
1	1	8 GB	2,300,000	1,150,000
2	2	16 GB	4,600,000	2,300,000
4	4	32 GB	9,200,000	4,600,000
8	8	64 GB	18,400,000	9,200,000
16	16	128 GB	36,800,000	18,400,000
32	32	256 GB	73,600,000	36,800,000
64	64	512 GB	147,200,000	73,600,000
128	128	1024 GB	294,400,000	147,200,000

磁盘索引容量（DiskANN）

CU 数量	CPU 数量	内存	预估最大向量条数（1024维，Int8，有标量字段）	预估最大向量条数（2048维，Int8，有标量字段）
1	1	8 GB	10,000,000	5,000,000
2	2	16 GB	20,000,000	10,000,000
4	4	32 GB	40,000,000	20,000,000
8	8	64 GB	80,000,000	40,000,000
16	16	128 GB	160,000,000	80,000,000
32	32	256 GB	320,000,000	160,000,000
64	64	512 GB	640,000,000	320,000,000
128	128	1024 GB	1,280,000,000	640,000,000

价格计算器使用说明

链接：https://console.volcengine.com/vikingdb/region:vikingdb+cn-beijing/bohr/price-calculator

价格计算器可基于你的数据与索引配置，输出三类核心预估结果：计算资源（CU）用量、存储资源（磁盘容量，单位 GB）、以及对应费用明细。
你可以通过两种方式打开计算器：

固定入口：登录 VikingDB控制台后，在左侧导航栏直接点击【价格计算器】进入

快捷入口：在创建索引页面，点击页面上的【价格计算器】按钮

计算器为表单驱动模式，每次修改配置后系统会自动触发计算，实时更新右侧预估结果，需要填写的参数如下：

向量类型：至少选择 1 类，支持多选，可选项包括稠密向量（Dense，最常用的 embedding 向量形式）、稀疏向量（Sparse，适用于稀疏特征 / 词袋场景）、张量（Tensor，适用于张量表征场景），选择后后续的索引类型、量化方式可选项会联动变化。
维度配置：
- 若选择稠密向量，需填写稠密维度，范围为 128~4096，维度越高检索效果越好，但资源开销也越大
- 若选择张量，需填写张量维度 n（范围 2~64）和张量维度 m（范围 4~2048），按张量实际 shape 填写即可
索引类型与量化方式：
- 索引类型默认 HNSW，可选项会随向量类型变化，例如仅选择稠密向量时，可选 HNSW、DiskANN、FLAT 等
- 量化方式默认 Float，还支持 Fix16、Int8等；若组合不兼容，系统会自动禁用不可选项并提示原因。
数据量：填写预估写入的向量条数，单位为百万条，取值范围 1~10000（百万）。
标量字段配置：若需要存储标题、标签等标量字段，可填写标量字段数，以及每个标量字段的平均长度，用于计算额外存储开销。

填写完所有参数后，右侧会自动输出三类预估结果：

CU 数量：即计算资源预估，受数据量、维度、索引和量化方式共同影响
磁盘大小：即存储资源预估，包含向量本体、索引结构及标量字段的总存储开销，单位为 GB
预估费用与明细：展示小时维度的预估费用，并拆分计算资源、存储资源等费用构成。

2.2 检索性能参考

CU 数量：不同 CU 规格的计算资源，包含 CPU 核数和内存大小；
预估最大QPS：在不同数量的768维向量、Int8量化、有标量字段、默认索引参数情况下，每个 CU 规格能支持的最大每秒查询量；

内存索引性能（HNSW、FLAT）

CU量	CPU数量	内存	预估最大QPS （100万条向量,768维,Int8量化,有标量字段）
1	1	8 GB	642
8	8	64 GB	3370

CU量	CPU数量	内存	预估最大QPS （1亿条向量,768维,Int8量化,有标量字段）
32	32	256 GB	4562
64	64	512 GB	9124

磁盘索引性能（DiskANN）

CU 数量	CPU 数量	内存	预估最大 QPS （100万条向量,768维,Int8量化,有标量字段）
1	1	8 GB	320
8	8	64 GB	1600

CU 数量	CPU 数量	内存	预估最大 QPS （1亿条向量,768维,Int8量化,有标量字段）
32	32	256 GB	2280
64	64	512 GB	4562

2.3 存储和性能的关系

需要注意的是，在固定的 CU 资源下，向量存储量与检索性能（QPS）往往此消彼长：当您存储的向量数量增加时，系统需要处理的数据规模也更大，查询速度可能会随之下降，无法达到理论最大性能。
因此，在规划向量数量和预期 QPS 时，要综合考虑业务需求和资源配比，找到数据存储与检索性能之间的平衡点。

最近更新时间：2026.04.16 22:28:35

这个页面对您有帮助吗？

有用

无用