You need to enable JavaScript to run this app.
导航

查看指定聚合维度的数值分布

最近更新时间2023.05.26 20:16:49

首次发布时间2022.08.22 21:41:55

1. 场景示例

背景:如图所示为一张订单粒度的数据集,具有每笔订单的详情数据,包括订单ID、订单发生的省份、订单金额等。

需求:根据省份聚合,计算各省份的总销售额(付款金额之和),并查看此数据(即各省销售额)的分布。分布:查看在0~20w、20~40w、40~60w、60~80w、80~100w、100w以上这些区间内的分布,即销售额在这些区间内的省份数量。


2. 设计思路

本案例的难点在于,数据集是订单粒度的,而需求查看的分布数据是省份粒度。因此需要依据省份聚合后,再做二次处理,查看分布数据。
聚合的思路如下:

(1)指定依据省份维度,求付款金额之和,形成「各省付款金额」字段

(2)利用分组功能,对各省付款金额分段:0~20w、20~40w、40~60w、60~80w、80~100w、100w

(3)将分段后的各省付款金额字段作为维度,计算省份的去重计数值,即省份数

3. 操作步骤

(1)创造「各省付款金额」字段

指定依据[省份]维度,求[付款金额]之和,并保存为维度。表达式为:
{fixed [省份]: sum([付款金额])}


(2)对各省付款金额分段

选择字段并创建组
按照步长分组,根据需求设置每个组的名称和条件


(3)计算各分段的省份数

将上述分组字段作为维度,拖拽「省份」字段到指标栏,聚合方式选择为“去重计数”作为指标。

图表类型选择为柱状图,并设置好排序。