You need to enable JavaScript to run this app.
向量数据库VikingDB

向量数据库VikingDB

复制全文
最佳实践
【向量库】计算资源配置参考
复制全文
【向量库】计算资源配置参考

本文介绍创建索引时,如何根据自己的数据量和检索量需求,选择合适的CU资源数量。

1 什么是CU?

CU资源:CU是衡量计算资源的单位,在向量数据库中,1 CU 代表 1 核 CPU 和 8GB 内存。CPU越多,能够承载QPS(每秒查询量)更大,内存越多,能够存储的向量就越多;
CU的计算公式:CU = max(CPU, 内存/8),即根据实际内存和CPU的消耗取最大来作为所需的CU数量;
内存自动扩缩容:数据量变多时会导致内存超额,VikingDB将自动扩容,内存减少后也会自动缩容,最小为用户手动配置的CU配额(CPU自动扩容暂不支持,即当实际QPS超过CPU能力后,不会自动增加CPU数量)。

2 如何选择CU?

2.1 存储容量参考

  • CU 数量:不同 CU 规格的计算资源,包含 CPU 核数和内存大小;
  • 预估最大向量条数:在不同向量维度(1024 维 / 2048 维)、Int8量化、有标量字段的情况下,每个 CU 规格能存储的最大向量条数;

说明

如何选择索引?
内存索引:HNSW最常用,适合向量维度中等、数据量在百万~上亿级,对延迟和 QPS 要求高的场景;HNSW-Hybrid在 HNSW 的基础上,同时索引稠密向量和稀疏向量,增加关键词信号;FLAT是全量暴力检索索引,查询速度相对较慢,但召回率最高,适用于候选集规模较小,数据量在几千~几万,对成本不敏感的场景。
磁盘索引:​DiskANN适合大规模数据(亿级及以上)、且并发要求不高的场景。此索引将将大部分数据存储在 SSD 上,仅将少量结构放入内存,可显著降低内存成本。

内存索引容量(HNSW、FlAT)

CU数量

CPU数量

内存

预估最大向量条数
(1024维,Int8量化,有标量字段)

预估最大向量条数
(2048维,Int8量化,有标量字段)

1

1

8 GB

2,300,000

1,150,000

2

2

16 GB

4,600,000

2,300,000

4

4

32 GB

9,200,000

4,600,000

8

8

64 GB

18,400,000

9,200,000

16

16

128 GB

36,800,000

18,400,000

32

32

256 GB

73,600,000

36,800,000

64

64

512 GB

147,200,000

73,600,000

128

128

1024 GB

294,400,000

147,200,000

磁盘索引容量(DiskANN)

CU 数量

CPU 数量

内存

预估最大向量条数
(1024维,Int8,有标量字段)

预估最大向量条数
(2048维,Int8,有标量字段)

1

1

8 GB

10,000,000

5,000,000

2

2

16 GB

20,000,000

10,000,000

4

4

32 GB

40,000,000

20,000,000

8

8

64 GB

80,000,000

40,000,000

16

16

128 GB

160,000,000

80,000,000

32

32

256 GB

320,000,000

160,000,000

64

64

512 GB

640,000,000

320,000,000

128

128

1024 GB

1280,000,000

640,000,000

2.2 检索性能参考

  • CU 数量:不同 CU 规格的计算资源,包含 CPU 核数和内存大小;
  • 预估最大QPS:在不同数量的768维向量、Int8量化、有标量字段、默认索引参数情况下,每个 CU 规格能支持的最大每秒查询量;

内存索引性能(HNSW、FlAT)

CU量

CPU数量

内存

预估最大QPS
(100万条向量,768维,Int8量化,有标量字段)

1

1

8 GB

642

8

8

64 GB

3370

CU量

CPU数量

内存

预估最大QPS
(1亿条向量,768维,Int8量化,有标量字段)

32

32

256

4562

64

64

512

9124

磁盘索引性能(DiskANN)

CU 数量

CPU 数量

内存

预估最大 QPS
(100万条向量,768维,Int8量化,有标量字段)

1

1

8 GB

320

8

8

64 GB

1600

CU 数量

CPU 数量

内存

预估最大 QPS
(1亿条向量,768维,Int8量化,有标量字段)

32

32

256 GB

2280

64

64

512 GB

4562

2.3 存储和性能的关系

需要注意的是,在固定的 CU 资源下,向量存储量与检索性能(QPS)往往此消彼长:当您存储的向量数量增加时,系统需要处理的数据规模也更大,查询速度可能会随之下降,无法达到理论最大性能。
因此,在规划向量数量和预期 QPS 时,要综合考虑业务需求和资源配比,找到数据存储与检索性能之间的平衡点。

最近更新时间:2025.12.02 15:15:10
这个页面对您有帮助吗?
有用
有用
无用
无用