维度归因是归因报告的一项重要功能,可以通过自动化数据归因模块,帮助用户对指标的变化在各个维度上进行拆解,并给出定量的贡献解释。本文为您介绍如何使用维度归因功能,包括归因配置和查看报告。
维度归因是一种在数据分析和数据可视化中使用的方法,用于解释某个指标或变量的变化和影响因素。它帮助我们理解一个指标背后的不同维度或类别对其变化的贡献程度。通过维度归因,用户可以深入了解大盘指标的变化原因,并明确各个维度对指标变化的影响程度。
假设我们正在研究一个电子商务网站的销售额。我们可以将销售额拆解为以下几个维度进行归因分析:地理位置、产品类别和营销渠道。
通过对这些维度的归因分析,我们可以更好地理解销售额的变化,找出其中的关键因素,并制定相应的策略来改进业绩。
对指标进行异动分析前,请您创建归因报告的「归因配置」,「归因配置」指定了进行分析和生成报告所需的相关参数,在归因配置完成之后,系统会根据配置例行运算,并生成报告和推送。
进入归因配置编辑页面后,选择「维度归因」。
按照步骤配置维度归因核心指标、业务日期和对比计算等内容。
配置核心指标参数,参数说明如下。
参数 | 配置说明 |
---|---|
数据集 | 选择需要分析的指标所在的数据集,下拉列表中的选项为当前项目内具有读权限及以上权限的所有数据集,支持输入名称搜索。 |
核心指标 | 从下拉列表中选择一个指标,可设置数据格式。
|
聚合方式 | 指定指标的聚合方式,可选求和、计数、计数不同和平均。
|
指标属性 |
|
在指定好核心指标之后,系统将自动提取出核心指标的表达式,并根据表达式的特性来自动选择贡献率算法。以下是公式和选取算法之间的映射关系:
贡献率算法 | 公式 |
---|---|
定基法 | 例如sum(); count(); count(distinct); sum()/sum(),更多请参考维度归因-算法 |
占比加权法 | sum()/sum(); sum()/count(),分子分母都可加的除法 |
剔除法 | 表达式中使用了LOD函数,请参考LOD 表达式 |
您需要指定以下内容:
日期 | 说明 | 备注 |
---|---|---|
基准日 | 以该日期作为基准值计算指标的变化 | 无 |
观察日 | 以该日期作为观察值 | 无 |
报告日 | 在该日期运行归因报告 | 当按天运行时,该选项固定为T表示为今天;当按周和月运行时,该日期可自行选择。 |
点击「添加」,可选择维度筛选或指标明细筛选对维度归因数据进行筛选。
如果想设置多个筛选条件,可以点击「添加」,在下方新增一组筛选条件。每组OR条件之外是用AND条件连接。
您需要指定维度归因的视角,可以选择三种不同维度的形式:
下钻 | 组合 | 自动发现 |
---|---|---|
|
|
|
举例:
分组维度的作用类似于仪表盘中的公共筛选器。在归因报告中放在顶部,以平铺的形式显示。
下图中的报告头部显示了app_id分组后的效果。All表示不分组,即大盘指标。
选择“188000”后,表示的是 app_id=188000时核心指标的值,以及归因的结果。
注意
分组维度支持添加多个,但是多个分组维度之间是 OR 的关系,并不是 AND 关系,所以建议只添加1个分组维度。
用户可以通过在维度归因报告中查看核心指标是否异动,来增加辅助业务决策的信息。
勾选“显示”后,需要继续指定异动检测方法,可选算法或自定义规则,功能和异动分析报告配置十分类似,可参考归因报告-异动分析。
对应在归因报告和推送卡片的头部将显示核心指标异动的结果:
如果您希望在一个归因报告里既能看到归因结果,还能方便地看到一些相关的数据看板,可以在「创建网页」中添加一个网页tab,地址输入需要的仪表盘地址,以实现方便地切换tab看到相关看板的效果。
在「新增归因」中,您可以直接输入以http://或https://开头的链接地址即可创建网页。
若需对网页执行重命名、复制及删除操作,请点击“更多”,将为您展开相关内容。
每次进入归因报告,将会进入到最新日期的报告页,报告主要分为两部分。
在分析报告页面的开头,可以选择切换查看不同日期运算的报告。
在归因报告的右上角,可以点击「查看归因配置」,快速跳转至当前报告的配置页面。
在归因报告页面支持大家配置快速进行自定义运算,在选择对比的时间范围后,将会按照该配置运算生成新的归因报告。
自定义时间段对比的归因报告会展示在选择归因报告日期的「自定义」列表中。
当归因配置中,维度归因选择了“自动发现”模式时,归因报告中会包含该模块。
系统将用户在配置时圈选的分析维度,使用 相对熵 并对结果经过分层后,定义出了根因维度。
点击展开图表后,将显示出所有参与分析的维度的 Surprise 值分布,其中高亮的维度为最终判定的根因维度。
每个维度归因视角下包含以下功能:
(1)表格和图表切换
默认为表格视图,点击后将切换成图表视图。将用瀑布图或拆解树来显示。
(2)TopN筛选
为了保证加载速度,默认取贡献率绝对值的Top10维度项显示。用户可更改或清空,即不进行TopN筛选。
(3)趋势图
对于维度归因报告,支持展示趋势图,可清晰展示各维度成员的变化趋势。此外,趋势图还支持勾选展示项、展示同比曲线(可选差异百分比、差异值、原始值)、跳转到可视化查询界面等功能。
说明
(4)高级模式
默认情况下表格中显示基本信息,包括:
打开高级模式后,将根据不同算法显示更多中间指标。
算法 | 高级模式下显示的指标 |
---|---|
定基法 | 分子和分母自身的变化情况;EP值 |
剔除法 | 剔除当前维度项后的父层级指标的变化情况;分子和分母自身的变化情况;剔除法得分 |
占比加权法 | 分子和分母自身的变化情况;种类内和种类间的贡献情况 |
EP 值:某维度下某因素波动占总体波动的比率----Explanatory power。
剔除法得分:剔除维度项后大盘的变化值-大盘变化值。得分越高说明对大盘影响越大。
种类内和种类间贡献:种类内表示该维度项分子对大盘变化的贡献;种类间表示该维度项分母对大盘变化的贡献。
(5)下载
当维度归因的方式选择为「下钻」或「组合」时,在右侧可以展开高级选项配置,勾选「计算“对核心指标的影响”」后,归因报告中才会出现对大盘的影响模块。
对大盘的影响表示各维度对大盘指标当期值的影响程度。
默认情况下表格中显示基本信息,包括:
注意:剔除该维度项后大盘指标的值与当前大盘指标的差值越大,说明该维度项对当前大盘指标影响越大。
点击图表切换按钮将从表格视图切换至散点图视图。
散点图共分4个象限:左上角的象限表示该维度项自身低于大盘&拉低了大盘;右下角的象限表示该维度项自身高于大盘&拉高了大盘。也就是说右下角象限内的维度项是表现好的维度项,左上角的维度项是表现差的维度项。
展示配置中每个维度的值和占比。占比=每个维度项的数值/核心指标值。占比越高对核心指标的影响越大。
采用剔除法来计算影响。剔除维度项对应值之后的核心指标值与原核心指标值的差值越大,该维度项的影响就越大。 举例:
下图中是计算的 2月15日这一天,类别对利润率的影响。剔除家具和技术后,利润率分别下跌2.32%和1.10%比原来低,说明家具和技术是表现较好的类别,没有它们利润率会变差。剔除办公用品后,利润率上涨了14.37%比原来高,说明办公用品是表现较差的类别,没有它利润率还能更好。
计算逻辑:父层级的利润是1291,销售额是19802,利润率是6.52%
第一行数据,剔除家具后利润率 =(1291-607)/(19802-3521)=4.20%
剔除家具后利润率的变动=6.52%-4.20%=2.32%