延迟(Latency)指的是请求从发送到接收响应所需的时间。在向量数据库中,降低延迟意味着更快地完成查询、写入或 Embedding 计算。
在优化延迟之前,建议先检查监控告警中的时延监控,确定具体的瓶颈点。
火山用户建议使用私网链接,避免公网传输带来的额外延迟。
若数据有明确的分区需求,建议使用 partition by 进行合理分区,以减少查询范围,从而降低查询延迟。
collection 和 index 初始化为全局变量,避免重复初始化带来的性能开销。# 获取指定索引,程序初始化时调用即可,无需重复调用 index = vikingdb_service.get_index("example", "example_index")
// 获取指定索引,程序初始化时调用即可,无需重复调用 Index index = vikingDBService.getIndex("javaSDKTest", "test_index");
// 获取指定索引,程序初始化时调用即可,无需重复调用 index, _ := service.GetIndex("go", "goIndex")
import { vikingdb } from '@volcengine/openapi' declare const service: vikingdb.VikingdbService // 替换为你初始化好的实例
若以上优化策略仍未达到预期效果,可联系我们,针对具体业务场景提供定制化优化方案。