max_marginal_relevance_search_by_vector--向量数据库VikingDB-火山引擎

文档中心

向量数据库VikingDB

请输入

SDK 接入 Langchain

max_marginal_relevance_search_by_vector

概述

max_marginal_relevance_search_by_vector 用于根据向量搜索相似的文本，并把结果根据 mmr（max marginal relevance）重新排序。

请求参数

参数	子参数	类型	是否必选	默认值	参数说明
embedding		List[float]	是		文本转化的向量。
k		string	是		重新排序数量。
lambda_mult		float	是		mmr 计算值参数。
params	filter	map	否		过滤条件，详见 filter 表达式说明。默认为空，不做过滤。过滤条件包含 must、must_not、range、range_out、georange 五类查询算子，包含 and 和 or 两种对查询算子的组合。
	limit	int	否	10	检索结果数量，最大5000个。
	output_fields	list<string>	否		过滤标量字段，指定要返回的标量字段列表。 output_fields 不传时，返回所有的标量字段。 output_fields 为空列表时，不返回 fields 字段。 output_fields 格式错误或者过滤字段不是 collection 里的字段时, 接口返回错误。
	partition	string/int	否	"default"	子索引名称，类型与 partition_by 的 field_type 一致，字段值对应 partition_by 的 field_value。 field_type 为 int64，list<int64> 时，partition 输入类型为 int64。 field_type 为 string，list<string> 时，partition 输入类型为 string，格式要求 "^[a-zA-Z0-9._]+$"。

filter 表达式

算子	算子说明	示例
must	针对指定字段名生效，语义为必须在 [...] 之中，即 "must in"。	`{ "op": "must", "field": "region", "conds": ["cn", "sg"] }`
must_not	针对指定字段名生效，语义为必须不在 [...] 之中，即 "must not in"。	`{ "op": "must_not", "field": "data_type", "conds": [1,2,3] }`
range	针对指定字段名生效，语义为必须在指定范围内。配置使用`gte`（大于等于）, `gt`（大于）, `lte`（小于等于）, `lt`（小于），用以圈定一维范围。另外，支持用 `center` 和 `radius` 表示二维圆内范围。	`// price 在 [100.0, 500.0) { "op": "range", "field": "price", "gte": 100.0, "lt": 500.0 } //price >= 100.0 { "op": "range", "field": "price", "gte": 100.0 } // 以 center 为中心，半径为50的圆内 { "op": "range", "field": ["pos_x", "pos_y"], "center": [100.0, 123.4], "radius": 50.0 }`
range_out	针对指定字段名生效，语义为必须在指定范围外。配置使用`gte`（大于等于）, `gt`（大于）, `lte`（小于等于）, `lt`（小于），用以圈定一维范围。	`// 筛选价格低于100或高于500的商品 { "op": "range_out", "field": "price", "gt": 500.0, "lt": 100.0 }`
georange	支持地理距离范围筛选。指定经纬度字段，以center为中心，筛选出地表距离在radius范围内的数据。	`// 距离center地表距离 radius 内 { "op": "georange", "field": ["longitude", "latitude"], "center": [100.12312, 22.4324], "radius": 50.0 }`
and	逻辑算子，针对逻辑查询需求，对多个条件取交集。	`{ "op": "and", // 算子名 "conds": [ // 条件列表，支持嵌套逻辑算子和 must/must_not 算子 { "op": "must", "field": "type", "conds": [1] }, { ... // 支持>=1的任意数量的条件进行组合 } ] }`
or	逻辑算子，针对逻辑查询需求，对多个条件取并集。	`{ "op": "or", // 算子名 "conds": [ // 条件列表，支持嵌套逻辑算子和 must/must_not 算子 { "op": "must", "field": "type", "conds": [1] }, { ... // 支持>=1的任意数量的条件进行组合 } ] }`

示例

请求参数

query = "What did the president say about Ketanji Brown Jackson"
vector = embedding.embed_query(query)
docs = db.max_marginal_relevance_search_by_vector(embedding.embed_query(query))
for i, doc in enumerate(docs):
    print(f"{i + 1}.", doc.page_content)

返回值

调用执行上面的任务，返回 List[Document]。

最近更新时间：2025.09.30 16:06:32

这个页面对您有帮助吗？

有用

无用

向量数据库VikingDB

filter 表达式 #

请求参数 #

返回值 #

filter 表达式

请求参数

返回值