You need to enable JavaScript to run this app.
导航
基于云搜索服务的分布式向量数据库
最近更新时间:2025.05.27 17:55:20首次发布时间:2024.01.04 10:20:50
我的收藏
有用
有用
无用
无用

本文介绍在大模型时代下的原生向量搜索和数据库的背景和应用场景。

背景信息

随着音视频、推荐等新兴领域应用的发展和对大模型场景的需求,引入多模态搜索来满足更加复杂的搜索势在必行。ES 在全文检索的基础上增加向量搜索能力来实现对非结构化数据的分析和检索。
在向量搜索的场景下,使用机器学习模型生成向量来表示数据对象(文本、图像、音视频等),向量距离代表对象间的相似性,常用的向量库使用 ANN 算法 和 KNN 算法,在极短时间内完成海量向量的检索。云搜索服务支持 k-NN 和 ANN能力,提供向量搜索、向量存储和 Embedding 能力,在 Cloud Search 的集群基础上,可以提供大规模分布式向量库能力,为用户带来可扩展数量级的向量搜索,同时,云搜索服务还能结合 ES 的倒排索引,可以将向量检索和全文检索的能力融合,实现更加强大的混合搜索(Hybrid Search)能力。
云搜索服务支持 DiskANN、HNSW、FAISS 和 IVF 等多种向量算法,可以应用于多种场景。在传统的向量引擎和算法都将索引结构和图放在内存里以加速计算,在几亿至千亿的海量多模态数据搜索的场景下,这种方式会占用大量的内存,造成系统稳定性差且成本极高。针对这一情况,火山引擎云搜索服务则利用了 IO 的能力来分担内存的压力,将 DiskANN 算法引入到 OpenSearch 中,实现了性能型和容量型的最优结合,并通过 RaBitQ 量化技术进行更高性能、更低成本的迭代,实现更大数据规模下更低成本的向量存储和检索能力。

Image

应用场景

基于 k-NN 的业务场景主要有以下六大类,目前在企业的业务场景中均有所运用:

  • 多模态搜索:包括图片搜索、语义搜索、音视频相似性检索等。
  • 智能推荐: 视频推荐、广告投放推荐、关系推荐、商品推荐等。
  • 智能问答:基于 Transformer 的 FAQ、LLM 的领域知识问答、LangChain 集合的生成式 QA。
  • 数据消重:视频、音频、图片的审核消重、各类素材版权检测。
  • 安全风控:欺诈检测、扫黑检测、危险评估、异常检测。
  • 其他应用:数据挖掘、数据分析、搜索重排序、文本搜图。

以文案相似度识别方案为例,实现流程如下:
Image
在用户推送文案的场景中,为保证用户体验,需要确保推送文案不会有重复内容,因此对每个推送的内容都会进行相似度识别并消重。
每个文案通过 BERT 模型生成 Embedding,在云搜索中检索一次。如果相似度低于阈值,判定为新的文案,会写入 k-NN 向量数据库中,逐渐完善成一个文案库;如果相似度高于阈值,则判定为重复文案,减少推送量。