【向量库】Instruction 参数设置--向量数据库VikingDB-火山引擎

文档中心

向量数据库VikingDB

最佳实践

【向量库】Instruction 参数设置

说明

向量库新版本（V2）中：

若您通过 VikingDB 在写入和检索时自动向量化，则无需单独配置 instruction，CreateVikingCollection 接口和 SearchByMultimodel 接口已提供默认参数配置 instruction 内容；
若用户有额外配置需求，可使用向量化计算(Embedding) 接口对 instruction 参数进行自定义配置，再通过 VikingDB 写入和检索向量数据。

设置 instruction 字段

instruction 字段是影响模型效果的关键。为了显著提升向量表示的精度，您需要根据具体的业务场景来定制该指令。除非符合后文“完整描述”的适用条件，否则不建议直接使用系统默认值。
通过合理设置 instruction，您可以引导模型更准确地聚焦输入内容的关键信息，从而适配特定的任务需求。这在跨模态检索、特定领域数据处理等场景中尤其有效。

注意：仅 doubao-embedding-vision-251215 及后续版本支持 instruction 字段。

配置规则

构建指令前需明确两种核心角色，二者在不同任务中的配置规则差异显著：

Query（查询侧）：发起检索 / 查询的主体，如用户输入的问题、检索关键词、待匹配的图片/视频等。
Corpus（语料侧）：被查询的对象，如文档库、图片库、视频库中的单条数据样本。

根据任务类型不同，Instruction 字段分为 召回 / 排序类 和 聚类 / 分类 / 语义文本相似度（STS）类 两大场景，具体配置模板如下表：

任务类型	是否区分 Query/Corpus	核心配置模板
召回、排序类	是	Query：Target_modality: {}.\nInstruction:{}\nQuery: Corpus：Instruction:Compress the {} into one word.\nQuery:
聚类、分类、STS 类	否	所有数据：Target_modality: {}.\nInstruction:{}\nQuery:

通用要求：所有模板仅需填充 {} 部分，其余固定内容禁止修改。

召回、排序类任务配置规则

此类任务用于根据 Query 计算与 Corpus 的相似度，实现目标内容的召回或排序，Query 和 Corpus 需分别配置 Instruction。

Query 侧配置

Target_modality: {}.\nInstruction:{}\nQuery:

字段填写说明

Target_modality 填充规则
- 填写依据：与 Query 自身模态无关，完全取决于待召回的 Corpus 底库的模态类型。
- 多模态混合场景：若 Corpus 库中存在多种独立模态样本（如部分为 text、部分为 image、部分为 video、部分为 text and video），需用 / 分隔所有模态；若 Corpus 库中每条样本均包含多种模态（如每条样本都有 text + video），则用 and 连接。
- 常见示例

Corpus 库模态情况	Target_modality 填写值
所有样本均为纯文本	text
所有样本均为图片 + 文本组合	text and image
所有样本均为纯视频	video
所有样本均为文本 + 视频组合	text and video
样本包含 text、image、video 三类	text/image/video
样本包含 text、video、text and video 三类	text/video/text and video

注意
Target_modality 的填写错误会直接导致检索精度下降，请严格匹配 Corpus 库或数据集的模态。

Instruction 填充规则
- 核心原则：禁止使用默认值 Compress the text into one word，需根据业务场景定制。
- 推荐示例
  - 文本检索：为这个句子生成表示以用于检索相关文章
  - 跨模态问答：根据这个问题，找到能回答这个问题的相应文本或图片

Corpus 侧配置

Instruction:Compress the {} into one word.\nQuery:

字段填写说明

填充依据：仅需匹配 当前单条 Corpus 数据的模态，无需考虑整个 Corpus 库的模态分布。
常见示例：text、image、video、text and image、text and video、image and video

聚类、分类、STS 类任务配置规则

此类任务不区分 Query 和 Corpus，所有数据采用完全相同的 Instruction 配置。

Target_modality: {}.\nInstruction:{}\nQuery:

字段填写说明

Target_modality 填充规则
- 填写依据：整个数据集的统一模态类型，所有数据的该字段值保持一致。
- 填写格式：与召回类任务的 Target_modality 格式一致（单模态填对应值，多模态组合用 and）。
Instruction 填充规则
- 核心原则：禁止使用默认值，需贴合具体任务场景。
- 典型示例
  - STS 语义相似度任务：Retrieve semantically similar text

高级用法

若上述指令无法满足需求，可以参考 MTEB (Massive Text Embedding Benchmark) 提供的示例指令进行尝试。

典型场景配置示例

纯文本任务

场景 1：对称检索（STS 语义相似度匹配）

场景描述：检索语义相似句子，如对比 “一只熊猫正从滑梯上滑下来” 和 “熊猫从滑梯上滑下来”。
配置规则：两条样本的 Instruction 完全一致。
Instruction 字段示例

Target_modality: text.\nInstruction:Retrieve semantically similar text\nQuery:

Input 字段：填写样本正文（如上述两个句子）。

场景 2：非对称检索（问答、摘要搜全文）

场景描述：用短 Query（问题 / 摘要）检索长 Corpus（答案 / 全文）。
配置示例

角色	Instruction 字段配置
Query	Target_modality: text.\nInstruction:为这个句子生成表示以用于检索相关文章\nQuery:
Corpus	Instruction:Compress the text into one word.\nQuery:

多模态任务

场景 1：对称检索（文 / 图 / 视频互搜）

通用前提：当文本为图片 / 视频的完整描述时（例如“蓝色的天空下，一只狗在草坪上奔跑，草坪上还有一些帐篷”），可使用默认指令配置。
配置示例

检索类型	Query 侧 Instruction 配置	Corpus 侧 Instruction 配置
文搜图	Target_modality: image.\nInstruction:Compress the text into one word.\nQuery:	Instruction:Compress the image into one word.\nQuery:
文搜视频	Target_modality: video.\nInstruction:Compress the text into one word.\nQuery:	Instruction:Compress the video into one word.\nQuery:
图搜文	Target_modality: text.\nInstruction:Compress the image into one word.\nQuery:	Instruction:Compress the text into one word.\nQuery:
视频搜文	Target_modality: text.\nInstruction:Compress the video into one word.\nQuery:	Instruction:Compress the text into one word.\nQuery:
图搜图（整体内容匹配）	Target_modality: image.\nInstruction:Compress the image into one word.\nQuery:	Instruction:Compress the image into one word.\nQuery:

特殊提示：若 Query 为短词文搜图（如 “蓝色海景”），建议替换 Query 侧 Instruction 为：Find me an everyday image that matches the given caption。
注意：图片局部截取检索原图，不属于对称检索，需按非对称检索配置。

场景 2：非对称检索

通用规则：仅在 Query 侧定制指令，Corpus 侧使用默认模板；指令需明确匹配规则。
典型场景示例

业务场景	Query 侧 Instruction 配置	Corpus 侧 Instruction 配置
跨模态问答（Query：文本问题；Corpus：文本 / 图片）	Target_modality: text/image.\nInstruction:根据这个问题，找到能回答这个问题的相应文本或图片\nQuery:	文本 Corpus：Instruction:Compress the text into one word.\nQuery: 图片 Corpus：Instruction:Compress the image into one word.\nQuery:
原图检索（忽略 PS 处理）	Target_modality: image.\nInstruction:查找与本图完全相同的图片，可能经过了 PS 处理，包含缩放、裁剪和水印，请忽略 PS 处理痕迹\nQuery:	Instruction:Compress the image into one word.\nQuery:
电商服装检索（忽略背景 / 人物）	Target_modality: image.\nInstruction:忽略背景以及人物主体并查找这张图片中出现的同款商品图片\nQuery:	Instruction:Compress the image into one word.\nQuery:
电商商品检索（文本描述搜图）	Target_modality: image.\nInstruction:根据下面的文本中对商品的描述，找到对应的符合条件的商品图片\nQuery:	Instruction:Compress the image into one word.\nQuery:
菜品检索（文本描述搜图）	Target_modality: image.\nInstruction:根据这段文本中提到的有关的菜品，找到相关的菜品的图片\nQuery:	Instruction:Compress the image into one word.\nQuery:

最近更新时间：2026.04.14 17:18:22

这个页面对您有帮助吗？

有用

无用

向量数据库VikingDB

设置 instruction 字段 #

配置规则 #

召回、排序类任务配置规则 #

Query 侧配置

Corpus 侧配置

聚类、分类、STS 类任务配置规则 #

高级用法 #

典型场景配置示例 #

纯文本任务

场景 1：对称检索（STS 语义相似度匹配）

场景 2：非对称检索（问答、摘要搜全文）

多模态任务

场景 1：对称检索（文 / 图 / 视频互搜）

场景 2：非对称检索

设置 instruction 字段

配置规则

召回、排序类任务配置规则

聚类、分类、STS 类任务配置规则

高级用法

典型场景配置示例