ByteHouse 云数仓版支持通过可视化方式实现图/文向量检索。本文将介绍如何在 ByteHouse 云数仓版控制台使用图/文向量可视化检索功能。
图 / 文向量可视化检索功能支持文本、图片及图文混合的多模态向量检索,通过将文本 / 图片转化为向量并进行相似度计算,实现高效检索。该功能提供可视化操作界面,支持检索对象的创建、管理与检索测试,适用于金融合规、电商推荐、智能驾驶、游戏等多领域中需要高效检索非结构化数据的场景,显著提升检索效率,适配复杂业务需求。
除了通过控制面实现向量检索外,ByteHouse 云数仓版也支持通过 SQL、Python 脚本、API 实现图 / 文向量写入和检索,操作详情请参见以下文档:
创建检索对象。在 ByteHouse 云数仓版控制台上,单击顶部 数据查询,单击创建检索对象,创建向量检索的目标对象。
在创建检索对象页面上,输入基本信息,并选择检索配置。
输入基本信息。您可自定义检索名称和描述,便于后续管理。
选择检索配置。
参数项 | 配置说明 |
|---|---|
检索字段 | 从下拉列表中选择需检索的数据库、表、字段,指定向量检索的目标数据对象。 |
向量模型 | 从下拉列表中选择检索使用的向量模型。当前 ByteHouse 支持 doubao-embedding-vision 模型,该模型面向文本、图片、视频等多模态内容向量检索的使用场景,支持中、英双语文本,最大128K输入。 |
计算组 | 选择执行向量检索的计算组,为向量检索指定计算资源。 |
过滤字段 | 设置为数据表中可用于设置为筛选规则的基础字段。 |
创建完成后,检索对象会展示在列表中,您可进行后续操作,如检索测试、编辑或删除。
单击检索对象所在行的检索测试按钮,在检索测试页面中配置检索参数。
参数项 | 配置说明 |
|---|---|
检索类型 | 支持文本、图片、文本+图片 3 种方式检索:
|
返回数量(TOP K) | 检索结果展示的最大行数,参数支持设置的范围为 1~200。 |
相似度得分 | 用于控制检索延时和精度,参数支持设置的范围为 1~100。 |
结果展示字段 | 展示在检索结果中的字段,默认展示数据表的前5个字段。 |
检索过滤 | 配置检索过滤条件,可在向量检索的基础上进一步缩小结果范围,提高查询精确度。
执行检索后,系统会根据过滤条件返回结果。 |
检索配置完成后,单击查询,ByteHouse 将根据您的设置,在右侧检索结果页面展示符合条件的结果。
(可选)创建完成后,您可在检索对象列表中单击检索对象所在行的编辑按钮,编辑检索对象的描述、计算组、过滤字段。
(可选)如果您不再需要该检索对象,您可在检索对象列表中单击检索对象所在行的删除按钮,删除检索对象。