embedding_v2是 embedding 接口的较新版本,建议使用此接口进行向量化处理。 embedding用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。
异步调用使用async_embedding_v2接口,参数不变。
说明
参数 | 子参数 | 类型 | 是否必选 | 可选值 | 说明 |
---|---|---|---|---|---|
EmbModel | modelName | string | 是 | doubao-embedding | 字节跳动研发的语义向量化模型,支持中英双语。当TPM超过5000时请前往火山方舟平台使用。
模型的计费规则可以前往向量库计费查看 说明 doubao-embedding 包括 240515 和 240715 两个版本,可通过 |
doubao-embedding-and-m3 |
模型的计费规则可以前往向量库计费查看 | ||||
doubao-embedding-large | 字节跳动语义向量化模型的最新升级版,采用能力更强的豆包语言模型为基座,支持中、英双语,当TPM超过5000时请前往火山方舟平台使用
模型的计费规则可以前往向量库计费查看 | ||||
doubao-embedding-large-and-m3 |
模型的计费规则可以前往向量库计费查看 | ||||
doubao-embedding-vision | 字节自研的图文多模态向量化模型,主要面向图文多模向量检索的使用场景,支持图片输入及中、英双语文本输入,最长 8K 上下文长度。当TPM超过5000时请前往火山方舟平台使用。
模型的计费规则可以前往向量库计费查看 说明 doubao-embedding-vision 包括 250328 和 241215 两个版本,可通过 | ||||
bge-large-zh |
模型的计费规则可以前往向量库计费查看 | ||||
bge-m3 |
模型的计费规则可以前往向量库计费查看 | ||||
bge-large-zh-and-m3 | 基于 bge v1.5 和m3 模型,使用混合检索模式。稠密向量由 bge v1.5 抽取,稀疏向量由 bge m3 抽取。
模型的计费规则可以前往向量库计费查看 | ||||
bge-visualized-m3 | 基于Visualized-BGE和m3 模型, 可对文本或图片进行单独编码,或者对文本图片对联合编码。
模型的计费规则可以前往向量库计费查看 | ||||
params | map | 否 | return_token_usage | 返回请求消耗的token数,默认关闭。 | |
return_dense | 返回稠密向量,默认打开。 | ||||
return_sparse | 返回稀疏向量,支持提取稀疏向量的模型默认打开, 其他模型开启了会报错。 | ||||
embedding_dimension | 用于对向量化结果降维。 | ||||
model_version | 用于切换模型版本。若模型有多版本,可以指定,不填则使用默认版本。当前doubao-embedding 模型支持"240515"(默认)和"240715"版本。 | ||||
RawData 说明 RawData 实例或者列表,最大 100 个。 | dataType | string | 是 | text | 文本 |
image | 图片 | ||||
text-image | 文本-图片对联合编码 | ||||
text | string | data_type 为 text 或 text-image时,必选 | data_type=text时,直接传入文本string | ||
image | string | data_type 为 image 或 text-image时,必选 | data_type=image时,传入图片内容的base64编码 |
HashMap<String, Object> params = new HashMap<>(); params.put("return_token_usage", true); ArrayList<RawData> rawDatas = new ArrayList<>(); rawDatas.add(new RawData().setDataType("text").setText("hello1").build()); rawDatas.add(new RawData().setDataType("text").setText("hello2").build()); Map<String, Object> res = vikingDBService.embeddingV2(new EmbModel().setModelName("bge-m3").setParams(params).build(), rawDatas); System.out.println(res);
Python 调用执行上面的任务,返回 list<float> 、list<list<float>> 类型的向量。