You need to enable JavaScript to run this app.
文档中心
向量数据库VikingDB

向量数据库VikingDB

复制全文
下载 pdf
控制台文档
目录递归检索
复制全文
下载 pdf
目录递归检索

目录递归检索是 OpenViking Service 面向用户开放的检索能力。通过“先定位高相关目录,再逐层向下展开”的方式,在大规模上下文中快速找到与 Query 最相关的内容。
相较于传统的扁平向量召回,目录递归检索不仅关注“哪一段内容和 Query 相似”,还会结合内容所在的目录层级、上层语境和文件归属进行综合判断,因此更适合在真实业务场景中检索用户记忆、Agent 技能上下文以及上传资源。

原理介绍

目录递归检索是 OpenViking Service 面向用户开放的一种结构化检索能力。它不是简单地把所有内容打散后做一次扁平召回,而是基于 OpenViking Service 的文件系统范式,在目录树中完成“定位 - 判断 - 下钻 - 返回”的递归检索过程。
其核心思想是: 先找到最可能相关的目录,再沿着目录层级逐步向下展开,最终定位到最相关的文件或内容节点。
在 OpenViking 中,资源、记忆、技能等上下文都不是孤立存放的,而是组织在具有明确语义的目录树中。一个目录不仅表示存储位置,也表示业务范围、主题边界和上层语境。因此,目录递归检索在判断相关性时,不仅会考虑某段内容与 Query 的文本相似度,还会综合考虑以下因素:

  • 内容所在目录的主题语义
  • 文件与上级目录之间的归属关系
  • 当前节点在目录树中的层级位置
  • 相邻目录和关联节点提供的上下文补充信息

从执行过程上看,目录递归检索通常包含四个步骤:

  1. 范围限定
    用户先选择检索范围,例如 User 、 Agent 或 Resources ,系统据此确定本次递归搜索的起始命名空间和目录边界。
  2. 目录级初筛
    系统优先在较高层级目录中判断哪些目录与 Query 更相关,先找到“可能命中的主题范围”,而不是一开始就对全部叶子文件做无差别展开。
  3. 逐层向下递归
    在命中高相关目录后,系统继续向其子目录和子文件递归检索,逐步缩小范围,直到定位到最相关的内容节点。
  4. 结构化结果返回
    最终返回的结果不仅包含命中文件本身,还会带上相似度分数、层级标识、路径信息和可查看详情,使用户能清楚理解“命中了什么、为什么命中、它位于哪里”。
    这种机制带来的价值主要体现在三个方面:
  • 更准确 :先按目录主题缩小问题空间,再在局部范围内精确命中内容
  • 更高效 :避免在全量上下文中做无差别展开,降低检索噪声
  • 更可解释 :检索结果天然带有目录层级和路径归属,便于用户理解和追踪

功能概览

当前目录递归检索界面支持以下使用姿势:

  • 输入 Query 发起检索
  • 配置返回数量,Top K 支持 1-20
  • 切换检索范围,在不同上下文命名空间内(User, Agent, Resources)递归搜索
  • 点击结果卡片查看具体文件详情
  • 通过路径信息跳转到对应文件或目录位置

适用场景

目录递归检索适用于以下典型场景:

  • 在用户长期记忆中查找某个偏好、实体或历史事件
  • 在 Agent 的技能与经验上下文中定位相关能力说明
  • 在上传的文档、图片、音视频等资源中查找最相关内容
  • 在海量目录结构中快速理解“信息在哪一层、属于哪个目录、是否值得继续展开”

使用流程

1. 输入 Query

用户在检索框中输入自然语言 Query,系统会基于该 Query 理解检索意图,并启动目录递归检索流程。
建议 Query 尽量具体,能够明确表达目标对象、主题或问题。例如:

  • “用户关于代码风格的偏好”
  • “OAuth 登录相关的接口说明”
  • “宠物猫 Oliver 的记录”

相比非常宽泛的关键词,更明确的 Query 更有利于系统快速锁定高质量目录和候选结果。

Image

2. 设置返回数量

检索前可通过“返回数量”控件设置本次检索返回的结果条数。

  • 支持范围:1-20
  • 默认值:10

该配置决定了最终结果列表中展示的候选数量。返回数量越大,覆盖面越广;返回数量越小,结果越聚焦。对于大多数业务场景,推荐优先使用默认值 10

3. 切换检索范围

目录递归检索支持按上下文范围进行切换。当前支持以下一级检索范围
Image
在 Agent 范围下,界面还支持继续下钻到更细的子目录或实例层级,包含记忆和技能目录。推荐使用方式如下:

  • 当目标信息明显属于用户历史认知时,选择 User
  • 当目标信息更接近工具能力或 Agent 工作流时,选择 Agent
  • 当目标信息来自上传文档或多模态文件时,选择 Resources

4. 发起检索

点击“检索”按钮后,系统会在所选范围内执行目录递归检索。
整体逻辑可以概括为:

  1. 根据 Query 和检索范围确定起始上下文范围
  2. 先进行初步召回,快速定位高相关目录
  3. 在高分目录中继续向下检索子目录和文件
  4. 结合层级语义和相关性分数进行排序
  5. 返回最终的 Top K 结构化结果

每条结果通常包含以下字段:

字段

说明

排名

当前结果在本次检索中的位置

相似度得分

按从高到低排序展示,越高表示与 Query 越相关

层级标识

显示命中内容属于 L0L1 还是 L2

结果摘要

对应命中文件或节点的核心内容预览

路径信息

展示该结果在上下文文件系统中的完整路径

其中,相似度得分是结果排序的重要依据,结果列表默认按照分数从高到低排列展示,便于用户优先查看最相关内容。

Image
点击任一结果卡片后,界面会打开对应结果的详情视图,展示该文件或节点的具体内容信息。
详情视图包括:

  • 当前结果的完整路径
  • 当前文件或节点的正文内容
  • 对应的层级标识
  • 文件路径跳转入口。用户可以点击【前往目录】直接在新页面跳转到当前文件的上下文管理界面,无需手动回到上下文管理中逐级查找文件。

Image
为了获得更稳定的检索效果,在使用目录递归检索时,我们推荐您遵循以下方式:

1. 优先限定检索范围

先切换检索范围,再输入 Query。这样能够显著缩小搜索空间,提升命中质量。

2. Query 尽量具体

建议直接描述对象、主题和目标,而不是只输入过于模糊的关键词。例如:

  • 更推荐:“登录页 OAuth 配置说明”
  • 不推荐:“登录”

3. 先看高分结果

结果列表默认按相似度从高到低排序。建议优先查看排名靠前、分数较高的结果,再决定是否继续扩大返回数量或调整检索范围。

最近更新时间:2026.05.26 11:13:08
这个页面对您有帮助吗?
有用
有用
无用
无用