You need to enable JavaScript to run this app.
导航

归因配置

最近更新时间2023.12.25 11:12:32

首次发布时间2021.06.08 18:58:58

什么是归因

归因分析用于计算用户行为(例如电商行业的商品购买成功、长视频行业的视频播放等)的产生主要来源于前面哪些场景下的哪些行为。将整个时间线上的用户行为经过去重后,构建一个转化路径图。例如电商行业常见的归因路径:曝光-点击-加入购物车-下单-购买成功。长视频行业常见的归因路径:曝光-点击-播放。

为什么需要配置归因
  • 完成归因配置及数据接入后,在数据质量&校验报告中,您可以查看每日的归因率,了解用户的行为主要来源于哪些场景下的哪些行为。CTR、CVR等统计指标也提供归因后的数据。
  • 在特征工程环节中,采用归因后的数据来生成样本,增强用户行为路径建模的效果。
  • 在A/B测试环节,采用的是归因后的数据进行各类指标计算,更贴近真实业务指标诉求。

如何配置归因

归因节点配置

点击画布中的「点击此处新增节点」按钮,选择行为类型后(支持的行为类型与与数据表模版中的bhv_type对应),即可新建一个归因节点。
图片
单击归因节点,可修改节点配置,包括:

  • spm配置:
    • 与数据表模版中的spm对应。
    • spm配置默认为全场景,可选择自定义场景。
    • 选择自定义场景时,支持通过「添加spm」操作配置多个spm,最多添加200个spm。
    • 支持选择「排除」,当勾选「排除」时,表示排除指定的spm,对其他spm的行为数据做归因。

      说明

      同一个行为类型,spm配置了默认全场景,则不能再自定义场景。

  • 归因key:根据归因key判断不同行为间是否可以进行归因,归因key完全相同的行为才可进行归因,作用于该节点下游的所有路径。

图片

归因路径配置

hover某个节点,即可操作新增上游/下游节点,并自动创建好节点间的路径;hover路径即可更改路径配置。
图片
归因路径配置包括:

  • 时间窗口:子节点归因父节点的时间窗口,例如上图中【conversion】行为归因到【cart】行为的时间窗口为1天(86400s)。
    • 若某两个行为节点间bhv_time的时间差在配置的时间窗口内,则归因成功,将用上游行为的字段值覆盖原有字段值。否则归因失败,认为这两个行为不属于一连串连续行为,字段值不进行覆盖。
    • timeWindow需要根据客户实际情况去配置,举个例子,如果实际业务场景中绝大部分的点击都发生自曝光后的1天内,那么timeWindows可设置为一天。timeWindow设置太短,会导致归因成功率降低,影响推荐效果。timeWindow设置太长,虽然归因成功率会提高,但是计算资源会增加,因此需要根据业务实际情况合理配置。
  • 权重:对于只有一个上游的节点,默认的权重为1。对于有多个上游的节点,首先看权重,权重相同的情况下默认按时间归因(找全部上游的最后一个);权重不同时,会优先找权重大的上游节点。例如cart同时归exposure和click,click的权重大,会优先找click,归因周期内没有click的,才会找exposure。

全局配置

  • 归因字段:下游节点继承父节点的属性字段,原有字段保存到 att_origin_*,归因成功后会用父节点的属性覆盖原有字段,失败的话就记录原值。大多数情况下使用默认配置即可。
  • 归因缓存时间:当行为接收时间 recieve_time 出现乱序时(例如曝光行为比点击行为后到达),归因不上的数据会缓存一段时间再进行归因,仅对流式归因生效。默认值是10秒,配置范围是 [1, 3600] 的正整数,当设置的时间窗口较大时,可能会影响性能,请谨慎设置。
  • 延迟时间:当 bhv_time 乱序时(例如曝光行为比点击行为的bhv_time更晚),会允许上游行为发生时间比下游行为发生时间晚一段时间,仅对流式归因生效。默认值是10秒,配置范围是 [1, 3600] 的正整数。

图片

修改归因配置

归因配置页面,单击右上角的「编辑」按钮,即可修改归因配置。
图片
修改完归因配置后单击右上角「提交」按钮,弹出「确定提交归因配置吗?」窗口,弹窗中可选择重跑的阶段(测试、历史、增量)和周期,选择「提交并重跑」表示提交配置并即刻重跑;选择「仅提交」表示暂不重跑仅提交配置更改。

  • 归因配置修改完成后,数据将按照新的逻辑做归因,建议重新确认设置是否合理,不要频繁修改。
  • 如果选择重跑,则会同时重跑预处理任务、统计校验任务和效果指标任务,会带来一定credit消耗。
  • 在增量阶段,如果仅天级/实时数据,均支持重跑;如果同时接入天级和实时数据,仅天级支持重跑,实时不支持重跑。

图片