目录递归检索--向量数据库VikingDB-火山引擎

文档中心

向量数据库VikingDB

控制台文档

目录递归检索

目录递归检索是 OpenViking Service 面向用户开放的检索能力。通过“先定位高相关目录，再逐层向下展开”的方式，在大规模上下文中快速找到与 Query 最相关的内容。
相较于传统的扁平向量召回，目录递归检索不仅关注“哪一段内容和 Query 相似”，还会结合内容所在的目录层级、上层语境和文件归属进行综合判断，因此更适合在真实业务场景中检索用户记忆、Agent 技能上下文以及上传资源。

原理介绍

目录递归检索是 OpenViking Service 面向用户开放的一种结构化检索能力。它不是简单地把所有内容打散后做一次扁平召回，而是基于 OpenViking Service 的文件系统范式，在目录树中完成“定位 - 判断 - 下钻 - 返回”的递归检索过程。
其核心思想是：先找到最可能相关的目录，再沿着目录层级逐步向下展开，最终定位到最相关的文件或内容节点。
在 OpenViking 中，资源、记忆、技能等上下文都不是孤立存放的，而是组织在具有明确语义的目录树中。一个目录不仅表示存储位置，也表示业务范围、主题边界和上层语境。因此，目录递归检索在判断相关性时，不仅会考虑某段内容与 Query 的文本相似度，还会综合考虑以下因素：

从执行过程上看，目录递归检索通常包含四个步骤：

范围限定
用户先选择检索范围，例如 User 、 Agent 或 Resources ，系统据此确定本次递归搜索的起始命名空间和目录边界。
目录级初筛
系统优先在较高层级目录中判断哪些目录与 Query 更相关，先找到“可能命中的主题范围”，而不是一开始就对全部叶子文件做无差别展开。
逐层向下递归
在命中高相关目录后，系统继续向其子目录和子文件递归检索，逐步缩小范围，直到定位到最相关的内容节点。
结构化结果返回
最终返回的结果不仅包含命中文件本身，还会带上相似度分数、层级标识、路径信息和可查看详情，使用户能清楚理解“命中了什么、为什么命中、它位于哪里”。
这种机制带来的价值主要体现在三个方面：

更准确：先按目录主题缩小问题空间，再在局部范围内精确命中内容
更高效：避免在全量上下文中做无差别展开，降低检索噪声
更可解释：检索结果天然带有目录层级和路径归属，便于用户理解和追踪

功能概览

当前目录递归检索界面支持以下使用姿势：

输入 Query 发起检索
配置返回数量，Top K 支持 1-20
切换检索范围，在不同上下文命名空间内（User, Agent, Resources）递归搜索
点击结果卡片查看具体文件详情
通过路径信息跳转到对应文件或目录位置

适用场景

目录递归检索适用于以下典型场景：

在用户长期记忆中查找某个偏好、实体或历史事件
在 Agent 的技能与经验上下文中定位相关能力说明
在上传的文档、图片、音视频等资源中查找最相关内容
在海量目录结构中快速理解“信息在哪一层、属于哪个目录、是否值得继续展开”

使用流程

1. 输入 Query

用户在检索框中输入自然语言 Query，系统会基于该 Query 理解检索意图，并启动目录递归检索流程。
建议 Query 尽量具体，能够明确表达目标对象、主题或问题。例如：

“用户关于代码风格的偏好”
“OAuth 登录相关的接口说明”
“宠物猫 Oliver 的记录”

相比非常宽泛的关键词，更明确的 Query 更有利于系统快速锁定高质量目录和候选结果。

2. 设置返回数量

检索前可通过“返回数量”控件设置本次检索返回的结果条数。

支持范围：1-20
默认值：10

该配置决定了最终结果列表中展示的候选数量。返回数量越大，覆盖面越广；返回数量越小，结果越聚焦。对于大多数业务场景，推荐优先使用默认值 10。

3. 切换检索范围

目录递归检索支持按上下文范围进行切换。当前支持以下一级检索范围

在 Agent 范围下，界面还支持继续下钻到更细的子目录或实例层级，包含记忆和技能目录。推荐使用方式如下：

当目标信息明显属于用户历史认知时，选择 User
当目标信息更接近工具能力或 Agent 工作流时，选择 Agent
当目标信息来自上传文档或多模态文件时，选择 Resources

4. 发起检索

点击“检索”按钮后，系统会在所选范围内执行目录递归检索。
整体逻辑可以概括为：

根据 Query 和检索范围确定起始上下文范围
先进行初步召回，快速定位高相关目录
在高分目录中继续向下检索子目录和文件
结合层级语义和相关性分数进行排序
返回最终的 Top K 结构化结果

每条结果通常包含以下字段：

字段	说明
排名	当前结果在本次检索中的位置
相似度得分	按从高到低排序展示，越高表示与 Query 越相关
层级标识	显示命中内容属于 `L0`、`L1` 还是 `L2`
结果摘要	对应命中文件或节点的核心内容预览
路径信息	展示该结果在上下文文件系统中的完整路径

其中，相似度得分是结果排序的重要依据，结果列表默认按照分数从高到低排列展示，便于用户优先查看最相关内容。

点击任一结果卡片后，界面会打开对应结果的详情视图，展示该文件或节点的具体内容信息。
详情视图包括：

当前结果的完整路径
当前文件或节点的正文内容
对应的层级标识
文件路径跳转入口。用户可以点击【前往目录】直接在新页面跳转到当前文件的上下文管理界面，无需手动回到上下文管理中逐级查找文件。

为了获得更稳定的检索效果，在使用目录递归检索时，我们推荐您遵循以下方式：

1. 优先限定检索范围

先切换检索范围，再输入 Query。这样能够显著缩小搜索空间，提升命中质量。

2. Query 尽量具体

建议直接描述对象、主题和目标，而不是只输入过于模糊的关键词。例如：

更推荐：“登录页 OAuth 配置说明”
不推荐：“登录”

3. 先看高分结果

结果列表默认按相似度从高到低排序。建议优先查看排名靠前、分数较高的结果，再决定是否继续扩大返回数量或调整检索范围。

最近更新时间：2026.05.26 11:13:08

这个页面对您有帮助吗？

有用

无用

向量数据库VikingDB

原理介绍 #

功能概览 #

适用场景 #

使用流程 #

1. 输入 Query #

2. 设置返回数量 #

3. 切换检索范围 #

4. 发起检索 #

1. 优先限定检索范围 #

2. Query 尽量具体 #

3. 先看高分结果 #