延迟(Latency)指的是请求从发送到接收响应所需的时间。在向量数据库中,降低延迟意味着更快地完成查询、写入或 Embedding 计算。
在优化延迟之前,建议先检查监控告警中的时延监控,确定具体的瓶颈点。
火山用户建议使用私网链接,避免公网传输带来的额外延迟。
若数据有明确的分区需求,建议使用 partition by 进行合理分区,以减少查询范围,从而降低查询延迟。
若以上优化策略仍未达到预期效果,可联系我们,针对具体业务场景提供定制化优化方案。