You need to enable JavaScript to run this app.
ByteHouse云数仓版

ByteHouse云数仓版

复制全文
向量检索
图/文可视化向量检索
复制全文
图/文可视化向量检索

ByteHouse 云数仓版支持通过可视化方式实现图/文向量检索。本文将介绍如何在 ByteHouse 云数仓版控制台使用图/文向量可视化检索功能。

背景信息

图 / 文向量可视化检索功能支持文本、图片及图文混合的多模态向量检索,通过将文本 / 图片转化为向量并进行相似度计算,实现高效检索。该功能提供可视化操作界面,支持检索对象的创建、管理与检索测试,适用于金融合规、电商推荐、智能驾驶、游戏等多领域中需要高效检索非结构化数据的场景,显著提升检索效率,适配复杂业务需求。
除了通过控制面实现向量检索外,ByteHouse 云数仓版也支持通过 SQL、Python 脚本、API 实现图 / 文向量写入和检索,操作详情请参见以下文档:

使用限制
  • 该功能为 Beta 功能,请联系提交工单或联系 ByteHouse 团队获取白名单权限。
  • 请确保您使用的 ByteHouse 引擎为 v2.3.3 及以上版本。您可登录 ByteHouse 云数仓版控制台,单击顶部租户管理,在基本信息页面中查看您使用的引擎版本。

准备工作

操作步骤
  1. 创建检索对象。在 ByteHouse 云数仓版控制台上,单击顶部 数据查询,单击创建检索对象,创建向量检索的目标对象。
    Image

  2. 在创建检索对象页面上,输入基本信息,并选择检索配置。

    1. 输入基本信息。您可自定义检索名称和描述,便于后续管理。
      Image

    2. 选择检索配置。
      Image

      参数项

      配置说明

      检索字段

      从下拉列表中选择需检索的数据库、表、字段,指定向量检索的目标数据对象。

      向量模型

      从下拉列表中选择检索使用的向量模型。当前 ByteHouse 支持 doubao-embedding-vision 模型,该模型面向文本、图片、视频等多模态内容向量检索的使用场景,支持中、英双语文本,最大128K输入。

      计算组

      选择执行向量检索的计算组,为向量检索指定计算资源。

      过滤字段

      设置为数据表中可用于设置为筛选规则的基础字段。

    创建完成后,检索对象会展示在列表中,您可进行后续操作,如检索测试、编辑或删除。

  3. 单击检索对象所在行的检索测试按钮,在检索测试页面中配置检索参数。
    Image

    参数项

    配置说明

    检索类型

    支持文本、图片、文本+图片 3 种方式检索:

    • 文本检索:支持纯文本输入(限 500 字内),支持粘贴文本。
    • 图片检索:图片支持 JPG/PNG/WEBP 格式,大小不超过 10 MB。
    • 文本+图片检索:支持同时输入文本和图片。

    返回数量(TOP K)

    检索结果展示的最大行数,参数支持设置的范围为 1~200。

    相似度得分

    用于控制检索延时和精度,参数支持设置的范围为 1~100。
    调升参数值会提高召回率,但会相对降低检索性能:得分越低召回结果越多,但检索准确度越低,得分越高召回越精准,但返回的数量越少。

    结果展示字段

    展示在检索结果中的字段,默认展示数据表的前5个字段。

    检索过滤

    配置检索过滤条件,可在向量检索的基础上进一步缩小结果范围,提高查询精确度。

    1. 从下拉列表中选择创建检索对象时设置的标量过滤字段。
    2. 选择过滤规则,支持设置为“包含”或“不包含”,并在输入框中填写对应的关键词。
    3. (可选)如需设置多个过滤条件,您可单击添加,新增条件行,并通过单击过滤配置前的“和”、“或”按钮,配置多个条件间的关系。

    执行检索后,系统会根据过滤条件返回结果。

  4. 检索配置完成后,单击查询,ByteHouse 将根据您的设置,在右侧检索结果页面展示符合条件的结果。
    Image

  5. (可选)创建完成后,您可在检索对象列表中单击检索对象所在行的编辑按钮,编辑检索对象的描述、计算组、过滤字段。
    Image

  6. (可选)如果您不再需要该检索对象,您可在检索对象列表中单击检索对象所在行的删除按钮,删除检索对象。
    Image

最近更新时间:2025.12.23 10:34:28
这个页面对您有帮助吗?
有用
有用
无用
无用