缺点:排序实际上不需要对资产进行精确打分,这类方法没有考虑召回资产之间的互相关系,考虑到用户在一组资产中只会点击其中一个,排名靠后的和排名靠前的资产在损失函数上的贡献没有体现。- Pairwise,对每... 错误点影响范围大。- Listwise,考虑给定输入下的召回资产集合的整体序列,优化整个序列,通常使用NDCG作为优化目标。 - 优点:优化整个序列,考虑序列内资产之间的关系。 - 缺点:单条样本训练量大。样...
**召回过程**(Recall),负责通过输入和筛选项根据文本相关度从Elasticsearch查询一定数量的搜索候选结果,供下一步精排使用。召回过程需要保证用户期望的结果包含在召回结果中,否则后续排序优化都是徒劳。同... 我们更看重模糊搜索的总体点击率和Top3点击率(输入和资产名称完全一致的为精确搜索,其它为模糊搜索)。实际上,点击率并非越高越好,过高的点击率可能意味着:- 搜索结果页透出的信息过少,用户不得不点击结果进入...