背景:如图所示为一张订单粒度的数据集,具有每笔订单的详情数据,包括订单ID、订单发生的省份、订单金额等。
需求:根据省份聚合,计算各省份的总销售额(付款金额之和),并查看此数据(即各省销售额)的分布。分布:查看在0~20w、20~40w、40~60w、60~80w、80~100w、100w以上这些区间内的分布,即销售额在这些区间内的省份数量。
本案例的难点在于,数据集是订单粒度的,而需求查看的分布数据是省份粒度。因此需要依据省份聚合后,再做二次处理,查看分布数据。
聚合的思路如下:
(1)指定依据省份维度,求付款金额之和,形成「各省付款金额」字段
(2)利用分组功能,对各省付款金额分段:0~20w、20~40w、40~60w、60~80w、80~100w、100w
(3)将分段后的各省付款金额字段作为维度,计算省份的去重计数值,即省份数
(1)创造「各省付款金额」字段
指定依据[省份]维度,求[付款金额]之和,并保存为维度。表达式为:
{fixed [省份]: sum([付款金额])}
(2)对各省付款金额分段
选择字段并创建组
按照步长分组,根据需求设置每个组的名称和条件
(3)计算各分段的省份数
将上述分组字段作为维度,拖拽「省份」字段到指标栏,聚合方式选择为“去重计数”作为指标。
图表类型选择为柱状图,并设置好排序。