embedding--向量数据库VikingDB-火山引擎

文档中心

向量数据库VikingDB

请输入

数据面SDK

embedding

概述

Embedding 接口用于将文本、图片、音视频等非结构化内容转为可检索的特征向量，支持同时输出稠密与稀疏向量。

说明

当前 Embedding 服务主要面向文本，部分模型支持多模态输入（文/图/视频）。
接口暂不承载高并发请求，请求过载时可能被丢弃。

请求体参数

参数	类型	是否必选	子参数	类型	是否必选	说明
dense_model	Optional[EmbeddingModelOpt]	二者至少选 1	name	str	是	模型名称。
			version	Optional[str]	否（豆包模型必填）	模型版本。
			dim	Optional[int]	否	稠密向量维度，缺省时使用模型默认值。
sparse_model	Optional[EmbeddingModelOpt]		name	str	是	模型名称。
			version	Optional[str]	否	模型版本。
			dim	Optional[int]	否	稀疏向量的输出维度。
data	List[EmbeddingData]	是	text	Optional[str]	二选一	纯文本内容。
			image	Optional[Any]	二选一	图片或图片 URL，遵循 MediaData 规范。
			video	Optional[Any]	二选一	视频 URL 或配置对象，可附带 `fps`、`value` 等抽帧参数。
			full_modal_seq	Optional[List[FullModalData]]	否	多模态序列输入。每个元素可再设置 `text`/`image`/`video` 字段。
project_name	Optional[str]	否				租户项目名称，便于区分不同环境。

媒体字段说明：

字段	类型	说明
text	str	UTF-8 编码的纯文本。
image	str 或 Dict[str, Any]	可直接填写图片 URL，或按照 MediaData 规范提供带鉴权参数的对象。
video	Dict[str, Any]	支持 `value`（视频 URL）和 `fps`（抽帧频率，默认 1，范围 0.2-5.0，最少 16 帧）。

模型列表

模型名称	模型版本	支持向量化类型	默认稠密向量维度	可选稠密向量维度	文本截断长度	支持稀疏向量	可支持instruction
bge-large-zh	(default)	text	1024	1024	512	否	是
bge-m3	(default)	text	1024	1024	8192	是	否
bge-visualized-m3	(default)	text、image及其组合	1024	1024	8192	否	否
doubao-embedding	240715	text	2048	512, 1024, 2048	4096	否	是
doubao-embedding-vision	250615	兼容241215和250328的用法。另外，支持full_modal_seq（文/图/视频序列）	2048	2048, 1024	128k	否	是

返回参数

字段	类型	说明
request_id	Optional[str]	请求链路 ID。
code	Optional[str]	错误码。
message	Optional[str]	错误信息。
api	Optional[str]	API 名称。
result	Optional[EmbeddingResult]	向量化结果，失败时为 `None`。

EmbeddingResult 结构：

字段	类型	说明
data	List[Embedding]	与请求顺序对应的向量结果列表。
token_usage	Dict[str, Any]	按模型统计的 token 使用量，包含 `prompt_tokens`、`completion_tokens`、`image_tokens`、`total_tokens` 等字段。

Embedding 结构：

字段	类型	说明
dense	Optional[List[float]]	稠密向量。
sparse	Optional[Dict[str, float]]	稀疏向量（键为 token，值为权重）。

示例

import os

from vikingdb import IAM
from vikingdb.vector import EmbeddingModelOpt, EmbeddingRequest, VikingVector

auth = IAM(ak=os.environ["VIKINGDB_AK"], sk=os.environ["VIKINGDB_SK"])
client = VikingVector(
    host=os.environ["VIKINGDB_HOST"],
    region=os.environ["VIKINGDB_REGION"],
    auth=auth,
    scheme="https",
)

embedding = client.embedding()
request = EmbeddingRequest(
    data=[{"text": "VikingDB provides a managed vector database."}],
    dense_model=EmbeddingModelOpt(
        name="doubao-embedding",
        version="240715",
        dim=2048,
    ),
    sparse_model=EmbeddingModelOpt(
        name="bge-m3",
        version="default",
        dim=1024,
    ),
)
response = embedding.embedding(request)

if response.result:
    print(f"embedding dense_dim={len(response.result.data[0].dense or [])}, sparse_len={len(response.result.data[0].sparse or [])}")
    print(f"token_usage={response.result.token_usage}")

最近更新时间：2026.04.28 18:05:41

这个页面对您有帮助吗？

有用

无用

向量数据库VikingDB

模型列表 #

模型列表