您在实际测试、生产的过程中,可能会遇到一些查询不符合预期的情况,针对这些难以调整搜索效果的场景,云搜索服务提供了多种调优策略。本文介绍控制台界面支持的调优方案。
对于 NLP 或大模型未学习到的词汇,且无需进行模型训练,直接将对应的词汇加入到云搜索服务就可以提高调优效率。您可以在云搜索服务控制台界面进行调优,包括同义词、权重干预和分词。
用户检索的关键词使用了一些别称,或者键入的时候输入了错别字,这样就无法准确匹配到云搜索服务实例中对应的文档信息,您可以通过配置同义词或纠错词进行调优。
举例说明:
配置同义词:
同义词支持手动导入和文件导入,配置规则如下:
配置完成后点击一键生效即可,生效时间在秒级别,生效完成后可以白屏化测试同义词效果。
相关文档:
权重干预可以通过调优结果得分,使得最终返回的结果列表符合预期。
权重干预逻辑如下:
举例说明:
type=手枪*1.2
。表示当查询词命中 M911 时,会将 type 为“手枪”的文档结果得分提升(权重*1.2);勃朗宁*0.9
。表示当查询词命中 M911 时,会将“勃朗宁”相关的文档结果得分降低(权重*0.9);
参考文档:添加类目预测词条
如果云搜索实例中明明有包含某关键词的文档,全文检索却无法通过该关键词匹配到,这很可能是因为关键词在写入时未被分词。
您可以通过云搜索服务的分词管理功能,自定义添加分词,支持手动导入和文件导入的方式添加分词。分词添加完成后,单击一键生效,即可在页面上进行分词测试验证。
分词更新完成后,需要对存量数据进行刷新,重新进行分词。
刷新数据使用update_by_query
进行刷新,对于 1000W 条文档以内的索引,都可以快速刷新完成。如果超过该量级,请联系云搜索服务技术支持。
相关文档: