You need to enable JavaScript to run this app.
导航
searchByMultiModal
最近更新时间:2025.11.14 17:04:49首次发布时间:2025.11.14 17:04:49
复制全文
我的收藏
有用
有用
无用
无用

概述

search_by_multi_modal 用于多模态数据检索。多模态数据检索是指向量数据库支持直接通过图文等多模态数据类型进行检索,且支持模态的组合,如文搜图,图搜图,图搜文+图等。

说明

  • 当前支持文本、图片、视频类型的非结构化数据。
  • Collection 数据写入/删除后,Index 数据更新时间预计20s,不能立即在 Index 检索到。

前提条件
  • 从控制台选择了从向量化开始的数据库类型,并在创建数据集时配置了向量化字段;或通过 create_collection 接口创建数据集时,通过设置 vectorize 参数配置了 Collection 的向量化功能。
  • 通过 upsert_data 接口写入数据时,已写入 text或image 类型的字段名称和字段值。
  • 通过 create_index 创建索引时,已创建 vector_index 向量索引。

请求参数

请求参数是 SearchByMultiModalRequest,其字段如下表所示。

名称

类型

必选

描述

text

Optional[str]

至少选 1

检索的输入文本。

image

Optional[Any]

检索的输入图片,支持:

  • TOS 链接,形如 tos://{bucket}/{object_key}
  • Base64 编码,形如 base64://{Base64编码}

video

Optional[Any]

JSON 结构,如:
{
"value": http/https/TOS 链接(必填)
"fps": 2.0 (0.2-5,可选)
}

filter

Optional[Dict[str, Any]]

标量过滤条件,详见标量过滤

  • 不填表示纯多模态检索。
  • 支持 must、must_not、range、range_out 等算子,可用 and / or 组合。

output_fields

Optional[List[str]]

要返回的标量字段列表。

  1. 未设置时返回集合内所有标量字段。
  2. 传入空列表表示不返回任何标量字段。
  3. 字段名必须存在于 collection schema,否则请求报错。

limit

Optional[int]

限制返回条数,最大 5000。

offset

Optional[int]

分页偏移量,默认 0,过大时会出现深分页性能开销。

partition

Optional[str]

指定检索的分区名称。

advance

Optional[SearchAdvance]

高级参数集合(post_process_ops、ids_in 等),详见检索公共参数

need_instruction

Optional[bool]

控制是否让模型自动补全 instruction,豆包系列默认 True,其他模型默认 False。

返回参数

名称

类型

描述

request_id

Optional[str]

请求链路 ID。

code

Optional[str]

服务返回码,Success 表示成功。

message

Optional[str]

错误或提示信息。

api

Optional[str]

具体调用的 API 名称。

result

Optional[SearchResult]

检索结果主体,结构见下。

  • SearchResult

名称

类型

描述

data

List[SearchItemResult]

召回到的结果列表,结构见下。

filter_matched_count

Optional[int]

满足过滤条件的文档总数。

total_return_count

Optional[int]

本次返回的结果数量。

real_text_query

Optional[str]

模型可能修正后的真实查询串。

token_usage

Dict[str, Any]

token 计量信息。

  • SearchItemResult

名称

类型

描述

id

Any

主键值。

fields

Dict[str, Any]

返回的标量字段内容。

score

Optional[float]

最终相似度得分。

ann_score

Optional[float]

ANN 粗排得分。

示例

请求参数

import os

from vikingdb import IAM
from vikingdb.vector import SearchByMultiModalRequest, VikingVector

auth = IAM(
    ak=os.environ["VIKINGDB_AK"],
    sk=os.environ["VIKINGDB_SK"],
)
client = VikingVector(
    host=os.environ["VIKINGDB_HOST"],
    region=os.environ["VIKINGDB_REGION"],
    auth=auth,
    scheme="https",
)

index_client = client.index(
    collection_name=os.environ["VIKINGDB_COLLECTION"],
    index_name=os.environ["VIKINGDB_INDEX"],
)
request = SearchByMultiModalRequest(
    text="找下类似品种",
    need_instruction=True,                  # need instruction improves prompt
    image="tos://zayn-viking/kind_dog.png", # upload to tos first
    limit=3,
)
response = index_client.search_by_multi_modal(request)
if response.result:
    for item in response.result.data:
        print(item.id, item.fields.get("image"), item.score)