混合搜索在 RAG 架构中,结合了两种或多种搜索算法,以提高搜索结果的相关性。本文介绍混合搜索场景开发的 3 个步骤:意图分析、问题重写和重排序。
已创建并启动混合搜索场景,场景状态为运行中。
通过大语言模型的能力对问题进行意图的分析,获取到问题中的关键特征。
参数 | 说明 |
|---|---|
模型来源 | 选择默认模型或方舟模型。 |
推理服务 | 选择已经创建的推理服务,如果需要新的推理服务,可参考创建推理服务。 |
模型 | 选择推理服务下关联的模型。 |
API Key | 选择已经创建的 API Key,如果需要新的 API Key,可参见创建 API Key。 |
能力选择 | 根据需要勾选以下选项:
|
针对意图分析中获取到问题的关键词,支持通过 DSL 配置为这些关键词设置检索规则,同时还支持通过设置不同的权重,调整关键词在召回阶段的分数。
参数 | 说明 | |
|---|---|---|
DSL 配置 | DSL 算子 | 支持 TERMS、KNN、MATCH、INTERVALS、CUSTOM、RANGE 算子类型。 |
匹配类型 | 支持 MUST、SHOULD、MUST NOT 三种类型。 | |
索引字段 | 选择需要应用的索引字段,支持多选。 说明 快速配置的索引内置两个字段,分别为 content 和 content_knn。
| |
参数配置 | 根据 DSL 算子的不同,参数配置也不同:
| |
召回数量 | 设置 DSL 配置返回的文档数量。 说明 建议设置较大召回数量,以便获取到更多的召回数据,有助于后续进行重排序。 | |
说明
重排序默认为关闭状态,开启可进行自定义配置。
将 DSL 配置阶段的召回结果输入到重排序模型,进行语义级重排序,输出得分最高的 Top N 的文档。
参数 | 说明 |
|---|---|
推理服务 | 选择已经创建的推理服务,如果需要新的推理服务,可参考创建推理服务。 |
模型 | 选择推理服务下关联的重排序模型。 |
返回数量 | 设置重排序后保留的文档数量。 |
场景开发配置完成后,您在开发与调试页签中进行测试。