You need to enable JavaScript to run this app.
导航
配置搜索策略
最近更新时间:2025.11.23 16:35:11首次发布时间:2025.10.14 23:36:26
复制全文
我的收藏
有用
有用
无用
无用

AI 搜索流程概述

AI 搜索包含召回、排序2个阶段:

Image
召回流程:​对用户输入的查询进行预处理后,与物品数据集中的多模态内容进行跨模态匹配召回计算。您可以通过以下配置项调整召回的策略:

排序流程:​对召回返回的搜索结果进行相关性的融合排序,同时可以介入您自定义的排序策略。您可以通过以下配置调整排序的结果:

您可以进入应用后,在 体验配置>搜索体验 页面配置召回和排序的策略。
Image

说明

如果应用中同时关联了多个数据集,需要对多个数据集的索引分别配置召回和排序的策略。可以从配置区域的数据集页签中选择需要配置的数据集。

配置每次召回结果总量

此参数用于控制当用户通过本应用进行搜索时,针对单个关联的数据集,在一次搜索请求中最多能够返回的结果条目数量。它直接决定了从每一个数据来源获取信息量的上限。如果您的应用关联了多个数据集,您可以为每一个数据集分别独立设置其搜索结果数量上限。这允许您根据不同数据集的重要性和内容特性,进行差异化的结果数量控制。
Image
默认值200
配置约束:​允许配置的值为 15000 之间的任意整数
例如: 假设您将应用关联的数据集 A 的结果上限设置为 5。那么,即使用户的某次搜索查询在数据集 A 中匹配到了 100 条结果,系统最终也只会从数据集 A 中返回最多 5 条最相关的结果。

配置多模态匹配策略

传入Query查询后,AI 搜索使用跨模态的混合检索来检索多数据源内容返回经相关性排序的搜索结果。您可以调整跨模态匹配的策略来调整匹配时的模态匹配权重,权重将影响模型评判内容与查询语句的相关性打分侧重。
您可以在搜索配置和对话配置的侧边栏找到配置选项:
Image
搜索匹配策略的方案将影响文本查询时匹配候选内容的模态权重和文本的语义/关键词权重。

预设配置

我们提供了3个预设,可按照您的业务诉求先使用预设配置来测试是否满足场景诉求。
均衡模式:采用预设的均衡权重,同时发挥向量检索(理解您输入的自然语言和图片意图)和关键词检索(精准匹配特定术语)的优势。这是最通用的设置,建议初次使用时选择。
语义检索优先:​此模式将主要依赖向量模型进行语义相似度计算。当您的搜索词是自然问句、描述性长句,或希望进行以文搜图,此模式效果更佳。
关键词检索优先:​此模式将主要依赖关键词匹配。当您需要查找包含特定产品型号、专有名词、编码等精确文本的内容时,此模式能提供更高的准确性。

自定义配置

若预设配置无法满足您的需求,可尝试打开自定义配置调整对不同类型特征的匹配权重。

匹配图/文内容的权重:
决定一条文本查询词在候选库中检索匹配时,更侧重匹配文本中的信息还是图片中的特征。

匹配文本语义/关键词内容的权重:
决定检索文本内容时,更侧重匹配语义特征还是关键词原文。这两种匹配方式各有侧重,理解它们的差异能帮助您更好地根据实际需求进行调整。

  • 语义匹配:理解内容“含义”
    语义匹配通过向量检索来实现,它将文本内容的“含义”或“上下文”编码成高维向量。
    更关注查询内容和数据库中存储文本的深层语义关联性。即使查询中没有出现完全相同的关键词,只要两者表达的意义相近,语义匹配也能找到高度相关的结果。
    适用场景:
    * 当您希望搜索结果能根据内容的概念主题进行匹配时。
    * 用户输入的查询可能非常口语化、长句或包含同义词时。
    * 需要进行跨语言搜索,或处理多种表达方式的相似内容时。
  • 关键词匹配:精准命中“字面”内容
    更注重查询词汇与文档中词汇的精确对应。如果查询的关键词在文档中出现,那么该文档就会被认为是相关的。
    适用场景:
    * 当您需要根据特定术语、产品型号、名称或代码进行精确查找时。
    * 在法律、医疗或技术文档等对词汇精确性要求极高的场景。
    * 用户明确知道他们正在寻找的特定关键词。

Image

配置自定义同义词匹配

AI搜索使用语义向量匹配,模型中已经学习到了共识性的有近似语义的词组特征,可在一定程度上解决通用的同义词匹配需求(例如:”苹果公司“和”apple“)。但对于专业术语或领域特定词汇的同义词匹配,建议通过自定义同义词表进行补充配置,以确保检索的准确性和完整性。
平台支持同义词组配置,在同一个同义词组内的多个词会被视为”互为同义词“。用户输入任何一个同义词组中的词汇时,包含同义词组其他词的物品会被判别为相关并召回。
在搜索体验配置右侧配置面板,可点击【管理同义词】按钮开始构建你的行业或品牌垂直同义词表:
Image
点击添加一个同义词组,可添加一组互为同义词的词组。
Image
一个词仅允许在唯一一组同义词组中出现,重复配置会导致系统无法确定该词的正确同义词映射关系,保存时系统会进行判重提示:
Image
配置完成后,点击【确定】保存至配置面板。在体验页面验证后可点击【生效当前配置】按钮使配置的同义词规则立即生效并应用于搜索服务。

开启搜索词纠错

Image
AI搜索在搜索框体验中提供自动关键词纠错能力,在用户的输入中存在拼写错误或常见错误时,系统会自动识别并提供纠正建议,从而提升搜索结果的准确性和用户体验。
在搜索配置 > 搜索词纠错 配置栏打开开关可见2类配置:

  • 直接纠正:​在系统识别出搜索词中的拼写和常见错误时,自动纠正为正确的词汇并直接返回纠正后的搜索结果,无需用户手动确认。
  • 仅做建议:​在系统识别出搜索词错误时,使用用户的原词进行搜索,同时提供纠正建议通过搜索接口返回,您可以在集成时,在页面上方显示*“您是否期望搜索:{纠正后的词汇}?”​*的提示,让用户自行决定是否采纳纠正建议。

选择任意一个模式,搜索接口中都会返回纠正后的建议搜索词,您可以根据您的搜索界面体验设计进行自由的集成。详见:Search - 搜索

开启语义重排

Image
此区域用于开启/关闭语义重排功能以及设置您想要重排的内容数量,从而为您优化前N个返回结果的准确性。通过开启语义重排,可为您减少搜索返回结果中不相关内容的干扰,提升搜索结果的准确性。
对于语义重排功能,语义的来源和理解主要依赖于您所提问的问题及相关的上下文,同时对搜索结果进行重排序将会在一定程度上影响搜索结果返回的速度,因此我们建议您主要在对话搜索中使用语义重排功能,对于全局搜索,由于单次搜索的文本内容长度较短,可被用于语义理解的文本内容较少,所以全局搜索中开启语义重排的效果往往有限,建议您视情况使用
我们将为您默认关闭语义重排功能,若您需要开启语义重排,可以在右侧控制栏中的搜索配置中找到语义重排的相关设置,在此处选择是否开启语义重排功能。开启语义重排后,默认配置为重排前20个结果,您也可以选择在侧边栏自定义您希望重排的结果数量(可配置范围为[2,100] ):
Image
对于配置有多个数据集的全局搜索,开启语义重排后,将分别对每个数据集进行语义重排。

  • 注意,语义重排功能仅对纯文本类型的搜索生效。​不支持包含图片、视频等非文本内容的搜索,若您开启语义重排后,在搜索问题中添加了图片内容,则语义重排将会自动关闭。
  • 若您的数据集中数据条数/您在搜索配置中设置的搜索结果数量上限小于您设置的语义重排数量,此时语义重排的结果数量不会超过您的数据条数/搜索结果数量上限。

对于语义重排功能所涉及的对应API字段内容,您可以通过查询搜索接口中的SearchResult部分获取更多信息。

配置自定义排序策略

在真实业务场景中,您可能有除了查询与内容匹配相关性之外的排序需求,例如“将最近上新的内容排在更前”、“将最近购买量更高的商品排在更前”等。您可以使用自定义排序策略来调整最终搜索结果的排序原则。

说明

AI搜索支持在控制台配置自定义的排序调节规则,也支持通过Search接口的"Sort by"参数对搜索结果列表做搜索后排序(详见Search - 搜索)。两者的区别和适用场景:

  • 自定义排序:​在返回搜索结果前,按照定义的排序字段做排序调整,在一批召回内容的相关性相近的情况下,将结果进行局部重排。最终的搜索结果是综合考虑相关性和自定义排序规则的,适合新度优先、热度优先等预置的业务策略。
  • 搜索后排序:​在返回搜索列表后,使用sort by和sort order对物品的指定字段做全局重排,适合用户在搜索列表页进行排序时调用接口重新排列搜索结果。

您可以在控制台-搜索体验页面配置自定义排序策略:

您可以按需配置物品的排序字段、排序策略以及不同策略之间的优先级:
Image
选择排序字段:​您可以选择一个物品中String,Float,Int类型的字段属性作为排序依据,例如 购买量(Int),上架时间("YYYY-MM-DD HH:MM:SS"类字符串)等。
选择正序/倒序:​选择依据字段值的大小进行正序或倒序调整,字符串类的排序按照字典序进行排序,数值类字段则按照数值大小排序。
调整策略的优先级:​如果您选择使用多个策略(比如按上架时间倒序 & 按购买量倒序),则需要定义一下策略之间的优先级。您可以通过拖动策略项来调整它们的执行顺序,排在前面的策略将优先应用于搜索结果排序。例如将“按上架时间倒序”排在“按购买量倒序”之前,在一组相关性相近的召回物品中,先按照上架时间倒序调整顺序,若其中2个物品上架时间一致(均为2025-8),则再按照购买量倒序进行二次调整。

配置自定义物品提权、降权

您可以使用提权、降权的策略来基于物品的属性来圈选一部分物品进行排序的提权奖励,或降权惩罚。
Image
提权和降权策略的配置可以抽象为:“满足{condition}条件下的物品,在被搜索召回时,排序得分提权{weight}”。其中:

  • {condition}:生效策略的物品范围对应的选择条件,以{属性字段}:{条件算子}:{值}来表示,比如"商品名"字段中包含"促销"关键词,"库存量"字段小于等于10,或者"价格"字段大于等于1000等。
  • {weight}:权重的值,可选择从-100%到100%之间(不包含0)的值。

您可以为应用中每个关联的数据集分别进行提权、降权策略的配置,在搜索配置界面中,配置栏数据集页签下点击【物品提权/降权】>【创建规则】即可创建一条新的提权或降权规则。

说明

您可以对单个字段配置多条提权、降权策略,权重系数会进行叠加,例如:

  • 价格>500元的物品提权50%
  • 价格>1000元的物品提权60%

当物品同时命中价格>500元和价格>1000元的条件时,其最终提权权重为110%(50% + 60%)。

基于属性的提权降权配置

当前支持每次添加一个对单一属性进行条件圈选并进行提权降权操作,基于物品字段配置生效范围的方式见下表:

字段类型

支持算子

支持传入的目标值

条件含义

举例

字符串(String

等于,不等于

字符串(String

字符串字段的值等于或不等于某个特定字符串时,进行提权 /降权

列表(Array<String> , Array<Int64>, Array<Int32>, Array<Float>

包含

对应格式中的列表

列表字段中包含目标列表中的所有元素,则进行提权/降权

在影视类型中,包含“悬疑”的物品进行提权

整型数值类(Int32 , Int64

大于,大于等于,小于,小于等于,不等于,等于

数值

整形字段中的值大于或小于某个具体数值时,进行提权/降权

物品上新时间(UNIX时间戳)大于1761661582(2025-10-28 22:26:22)时,进行提权

浮点数( Float

大于,小于

数值

浮点数中的值大于或小于某个具体数值时,进行提权/降权

价格大于500元的物品进行提权

基于地理位置的提权降权配置

当您的业务场景需要根据用户的地理位置距离对搜索结果进行动态调整时,可以通过配置基于地理位置的提权降权策略来实现。排序引擎将基于使用接口上传的用户地理位置和物品的地理位置进行距离计算,并对计算后的距离应用提权降权规则。
在设置策略前,请确保您的物品数据中包含经纬度信息,并且已配置为经度和纬度属性,经纬度属性配置详见图文物品数据集介绍
Image
在控制台配置提权降权策略
Image

  1. 导航到「计算字段」,选择「用户与物品距离」。

Image

  1. 在条件设置部分,从下拉菜单中选择‘大于’或‘小于’,在输入框中填写距离数值(如 20),并选择单位(如 km)。

Image

说明

当存储地理位置的字段是一个JSON对象列表,如果一个物品存在了多组「经度」和「维度」坐标,例如:
"location":[{"long":121.228,"lat":32.112},{"long":124.029,"lat":33.072}]
平台在计算与用户的距离时,会自动选择离用户最近的那组坐标。

在接口请求中上传用户地理位置
API请求的 context 对象中必须包含 location 字段来上传用户当前调用搜索时的地理位置。详情请查看 Context
体验地理位置提权搜索
配置提降权策略后,体验页面将引导您去在左侧模拟用户的地理位置来体验提降权效果:
Image
在左边「测试用户」区域,通过指定位置能力,模拟用户位置提降权的场景:

配置方案

说明

获取我的位置

获取您当前的位置来模拟测试用户,此操作需要您授予浏览器位置权限。

说明

如果点击了「获取我的位置」后,平台不自动获取经纬度,请检查:

  1. 电脑是否开启了位置能力
  2. 电脑、浏览器是否限制了浏览器位置获取的权限

若之前禁止浏览器位置获取的权限,必须重启电脑,重置权限限制。

指定用户位置

手动输入经纬度坐标(如 经度:39.9°纬度:116.4°