searchByMultiModal--向量数据库VikingDB-火山引擎

文档中心

立即注册

向量数据库VikingDB

检索(Search)

searchByMultiModal

概述

search_by_multi_modal 用于多模态数据检索。多模态数据检索是指向量数据库支持直接通过图文等多模态数据类型进行检索，且支持模态的组合，如文搜图，图搜图，图搜文+图等。

说明

当前支持文本、图片、视频类型的非结构化数据。
Collection 数据写入/删除后，Index 数据更新时间预计20s，不能立即在 Index 检索到。

前提条件

从控制台选择了从向量化开始的数据库类型，并在创建数据集时配置了向量化字段；或通过 create_collection 接口创建数据集时，通过设置 vectorize 参数配置了 Collection 的向量化功能。
通过 upsert_data 接口写入数据时，已写入 text或image 类型的字段名称和字段值。
通过 create_index 创建索引时，已创建 vector_index 向量索引。

请求参数

请求参数是 SearchByMultiModalRequest，其字段如下表所示。

名称	类型	必选	描述
text	Optional[str]	至少选 1	检索的输入文本。
image	Optional[Any]		检索的输入图片，支持： TOS 链接，形如 `tos://{bucket}/{object_key}`。 Base64 编码，形如 `base64://{Base64编码}`。
video	Optional[Any]		JSON 结构，如： { "value": http/https/TOS 链接（必填） "fps": 2.0 （0.2-5，可选） }
filter	Optional[Dict[str, Any]]	否	标量过滤条件，详见标量过滤。不填表示纯多模态检索。支持 must、must_not、range、range_out 等算子，可用 and / or 组合。
output_fields	Optional[List[str]]	否	要返回的标量字段列表。未设置时返回集合内所有标量字段。传入空列表表示不返回任何标量字段。字段名必须存在于 collection schema，否则请求报错。
limit	Optional[int]	否	限制返回条数，最大 5000。
offset	Optional[int]	否	分页偏移量，默认 0，过大时会出现深分页性能开销。
partition	Optional[str]	否	指定检索的分区名称。
advance	Optional[SearchAdvance]	否	高级参数集合（post_process_ops、ids_in 等），详见检索公共参数。
need_instruction	Optional[bool]	否	控制是否让模型自动补全 instruction，豆包系列默认 True，其他模型默认 False。

返回参数

名称	类型	描述
request_id	Optional[str]	请求链路 ID。
code	Optional[str]	服务返回码，Success 表示成功。
message	Optional[str]	错误或提示信息。
api	Optional[str]	具体调用的 API 名称。
result	Optional[SearchResult]	检索结果主体，结构见下。

SearchResult

名称	类型	描述
data	List[SearchItemResult]	召回到的结果列表，结构见下。
filter_matched_count	Optional[int]	满足过滤条件的文档总数。
total_return_count	Optional[int]	本次返回的结果数量。
real_text_query	Optional[str]	模型可能修正后的真实查询串。
token_usage	Dict[str, Any]	token 计量信息。

SearchItemResult

名称	类型	描述
id	Any	主键值。
fields	Dict[str, Any]	返回的标量字段内容。
score	Optional[float]	最终相似度得分。
ann_score	Optional[float]	ANN 粗排得分。

示例

请求参数

import os

from vikingdb import IAM
from vikingdb.vector import SearchByMultiModalRequest, VikingVector

auth = IAM(
    ak=os.environ["VIKINGDB_AK"],
    sk=os.environ["VIKINGDB_SK"],
)
client = VikingVector(
    host=os.environ["VIKINGDB_HOST"],
    region=os.environ["VIKINGDB_REGION"],
    auth=auth,
    scheme="https",
)

index_client = client.index(
    collection_name=os.environ["VIKINGDB_COLLECTION"],
    index_name=os.environ["VIKINGDB_INDEX"],
)
request = SearchByMultiModalRequest(
    text="找下类似品种",
    need_instruction=True,                  # need instruction improves prompt
    image="tos://zayn-viking/kind_dog.png", # upload to tos first
    limit=3,
)
response = index_client.search_by_multi_modal(request)
if response.result:
    for item in response.result.data:
        print(item.id, item.fields.get("image"), item.score)

最近更新时间：2025.11.14 17:04:49

这个页面对您有帮助吗？

有用

无用

向量数据库VikingDB

请求参数 #

请求参数