个性化推荐场景--Viking AI 搜索-火山引擎

文档中心

Viking AI 搜索

常见问题排查手册

个性化推荐场景

个性化推荐场景问题解答

说明

本文档是一篇关于推荐系统的故障排查指南，旨在帮助用户在遇到推荐结果为空、个性化效果不佳等常见问题时，能够快速定位原因并解决问题。
通过本文，您可以了解常见问题的排查思路和具体操作步骤，从而提升推荐系统的效果和稳定性。
想要体验更多 Viking AI 搜索能力，点击前往：Viking AI 搜索引擎，企业搜推问一体化智能引擎

排查模块	排查逻辑与建议
行为数据质量	物品id：能在物品表里找到行为时间：7天以内的（7天以外的也可以传，但必须有7天以内的）行为类型：曝光+非曝光的正向行为（比如点击、收藏、购买等）都要有行为条数：尽可能多，至少1000条
操作流程	操作流程：首先，在控制台的“应用管理”页面，为您的应用关联至少一个物品数据集并点击“生效”。然后，在同一页面关联用户行为数据集并点击“生效”。最后，在页面顶部点击“生效配置”按钮以应用所有更改。请注意，行为数据集的关联和生效，必须在图文数据集生效后进行。请务必遵循此顺序，因为用户行为数据（如点击）需要关联到具体的物品上，如果物品数据集尚未生效，系统将无法解析行为数据中的物品信息，导致关联失败。
筛选推荐物品	核心是没有满足上面所有条件的物品，拆开看可能的原因：「或」逻辑配置误配置为「且」物品表里字段传输有问题，实际值不是定义的格式仅仅因为没有物品满足全部条件
去除重复推荐	都被曝光去重、下发去重过滤掉了
兜底策略配置	兜底策略是否合理
物品数据质量	物品的标签字段要有值。这个设置为标签的字段是火山侧模型推断的，客户侧若有更合适的字段，可以联系火山侧变更

排查项	排查逻辑与建议
召回结果重排	召回结果重排数量是否太大。建议配置为20个
用于文搜的是否有大字段

召回通道	召回逻辑	客户侧确认优化
用户兴趣召回	根据全量行为数据计算每个标签下的高热物品获取用户最近7天正向行为过的物品的标签列表，逐个对列表里的标签去获取高热物品注：这里的标签是平台大模型分析物品表字段后自动选择的某个字段，客户可以看下面展示的标签值推断来自哪个字段	行为数据数据量大包括曝光和正向行为（比如点击、购买、播放等物品要能在物品数据里找到物品数据分析火山自动选择的兴趣维度字段是否合适，判断标准该字段值符合业务侧对用户兴趣维度的权衡，比如一般选择字段有：商品类目、资讯标签该字段值的覆盖率高，即大部分物品的这个字段都是有值的该字段的枚举值具有区分度（应避免大部分甚至全部内容都有某个标签值），不要太稀疏（禁忌枚举值非常多，大部分枚举值对应的内容数都很少）如果有更合适的标签字段，请联系火山技术支持调整
大模型召回	对每个物品都做embedding，依赖选择的用于文搜的字段信息获取用户最近7天正向行为过的物品列表，做embedding后去向量检索相似的物品	物品数据用于文搜的字段要勾选有核心信息的字段，比如标题、类目等不要勾选非核心信息，防止有太多庞杂信息稀释了核心信息浓度，检索出不相关的物品
itemcf召回	根据全量行为数据计算物品和物品的相似性获取用户最近7天正向行为过的物品列表，逐个对列表里的物品去获取相似性高的其他物品	行为数据数据量大包括曝光和正向行为（比如点击、购买、播放等）

详情页场景未推出父物品相似物品

排查项	排查逻辑
API传参	检查：传参格式是否正确。正确传参如下：
父物品	检查：父物品id必须在物品数据集内

排查模块	排查逻辑
去除重复推荐	如果去重配置太小，则每次新推荐时，只过滤掉最近很少推出过的物品，就可能会推出之前已经推荐过的物品。（当前曝光去重可设置的最大时间窗口为7天）
行为数据实时性	检查曝光的行为数据有没有实时的同步到火山平台？如果延迟较高，【已曝光物品去重】获取不到曝光的物品，导致消重失败（建议：提高行为数据实时性+增加【已下发的物品去重】

打散未生效

排查项	排查逻辑与建议
确认是否真的没有生效	把打散字段也放在output_fields里，通过接口返回的信息验证是否没有打散在产品界面上看，可能会出现实际上生效，但看着没打散的情况，主要是跨刷逻辑导致的，详细逻辑如下：当前打散生效范围是每一刷内，比如一刷返回5个，配置的打散逻辑是则每一刷内部是可以满足4个最多出1个同类，但可能第一刷的最后一个和第二刷的第一个就是一个维度的，就出现了实际浏览应用时出现的集中出现的情况，这种情况在功能逻辑上是符合预期的。
打散程度是否过高	如果把内容打的非常散，比如连续非常多个都不允许出现同样维度，就可能因为召回的物品根本没有这么多种类，导致最后打散失败。并且从个性化推荐的实践来说，每个用户在某些维度上是有特定偏好的，比如某用户最近就是想买某种款式的羽绒服，某用户就是喜欢某一个作者的作品，那在推荐上就是会多给用户返回这类物品。最后，因为打散只在一刷内生效，如果一刷返回10个物品，打散若配置连续20个最多展示n个，则也很可能会出现不符合预期的结果。所以建议：
打散字段是否合适	嵌套字段不能用来打散字段若为空值或者没有打散字段，作为同一个维度处理，所以若打散字段里有较多空值，会增加打散失败概率

排查项

排查逻辑与建议

确认是否真的没有生效

把打散字段也放在output_fields里，通过接口返回的信息验证是否没有打散
在产品界面上看，可能会出现实际上生效，但看着没打散的情况，主要是跨刷逻辑导致的，详细逻辑如下：
1. 当前打散生效范围是每一刷内，比如一刷返回5个，配置的打散逻辑是

则每一刷内部是可以满足4个最多出1个同类，但可能第一刷的最后一个和第二刷的第一个就是一个维度的，就出现了实际浏览应用时出现的集中出现的情况，这种情况在功能逻辑上是符合预期的。

打散程度是否过高

如果把内容打的非常散，比如连续非常多个都不允许出现同样维度，就可能因为召回的物品根本没有这么多种类，导致最后打散失败。
并且从个性化推荐的实践来说，每个用户在某些维度上是有特定偏好的，比如某用户最近就是想买某种款式的羽绒服，某用户就是喜欢某一个作者的作品，那在推荐上就是会多给用户返回这类物品。
最后，因为打散只在一刷内生效，如果一刷返回10个物品，打散若配置连续20个最多展示n个，则也很可能会出现不符合预期的结果。
所以建议：

打散字段是否合适

嵌套字段不能用来打散
字段若为空值或者没有打散字段，作为同一个维度处理，所以若打散字段里有较多空值，会增加打散失败概率

原因分类	排查逻辑与建议
API里传了，但是筛选策略里没有配置
筛选策略里配置动态筛选，但是API传参里没有传
动态过滤传参不合法
逻辑条件检查	筛选过滤表达式逻辑「不属于」后若是列表，是都匹配上才符合，而不是存在交集即可如果希望是匹配上一个就过滤，则可以用多个表达式来表示
其他逻辑条件选错	检查配置的是否是「或」的逻辑

Viking AI 搜索

个性化推荐场景问题解答

推荐返空

推荐耗时长

推荐场景用户画像为空

推荐结果不够个性化

详情页场景未推出父物品相似物品

推荐返回的物品重复

打散未生效

推荐-过滤没有生效

Viking AI 搜索

个性化推荐场景问题解答 #

推荐返空 #

推荐耗时长 #

推荐场景用户画像为空 #

推荐结果不够个性化 #

详情页场景未推出父物品相似物品 #

推荐返回的物品重复 #

打散未生效 #

推荐-过滤没有生效 #

个性化推荐场景问题解答

推荐返空

推荐耗时长

推荐场景用户画像为空

推荐结果不够个性化

详情页场景未推出父物品相似物品

推荐返回的物品重复

打散未生效

推荐-过滤没有生效