事件分析作为数据分析最重要的分析方法之一,能够帮助我们研究某行为事件的发生对企业所产生的价值影响。火山引擎增长分析「事件分析」支持通过构建指标、分组筛选及多种可视化图表对用户行为进行多维分析,同时在数据智能洞察方面提供了异常数据分析的功能,可以帮助我们发现更多数据异常带来的影响。本文为您介绍DataFinder事件分析工具的使用详细指导。
进行事件分析前,您需要了解事件分析工具涉及的主要概念,帮助您了解事件分析工具的分析逻辑,简介如下,详细的事件分析工具涉及的数据模型相关概念的介绍请参见数据模型。
术语 | 概念介绍 |
|---|---|
事件(Event) | 事件即用户行为的数据化描述。例如,在某视频APP中,用户观看了内容A后对博主推荐的商品产生了兴趣,随后点击了评论区中商品链接,在电商中完成了购买。观看视频、点击链接、下单购买等一系列用户行为,在通过埋点数据化后即可通过“事件”来描述。 |
属性(Params) | 在火山引擎增长分析平台中,我们通过“事件名称+属性列表”组合的方式来详细准确的描述用户行为:
注意 在增长分析平台中,属性目前支持字符串(string)和数值(int)两种取值类型。
根据应用范围,属性又分为“事件属性”和“公共属性”两类。 |
事件属性 | 与单个或几个事件相关的属性,用以对这些事件进行展开描述,如video_play事件的video_id、video_name、play_mode属性,或video_add_favorite事件的video_id属性。 |
事件公共属性 | 事件公共属性可以为所有事件所共用,如事件发生的时间、app版本、ip地址等。 说明 DataFinder中,除事件属性、事件公共属性外,还有用户属性,用于描述用户的相关信息,例如,用户的年龄、性别等。 |
事件分析 | DataFinder为您提供“事件分析”工具,可通过构建指标、分组筛选及多种可视化图表对用户行为进行多维分析。
DataFinder的事件分析功能非常灵活,可以很好的满足各类场景下的统计需求。 |
指标 | 数据分析的指标与分析的业务目标相关,通常可通过量化的事件数值来体现待分析的业务指标**。DataFinder中可通过**选择事件、事件/属性数值的计算方式来定义事件分析的指标,并支持通过属性的过滤条件进行过滤分析。 |
使用DataFinder事件分析时,您可以根据业务目标选择待分析的指标。指标可基于选择的事件,通过指标算子进行逻辑计算和统计分析。以下为DataFinder事件分析指标支持的指标算子和各算子的计算逻辑说明。
注意
以下算子描述中,数值型属性目前特指int、float两种类型。
指标算子 | 含义 | 举例 |
|---|---|---|
总次数(PV) | 统计事件的发生次数 | 统计用户在app内播放视频的总次数 |
总人数(UV) | 统计事件的发生人数 | 统计在app内播放过视频的去重用户总数 |
渗透率(UV/AU) | 事件触发总人数/全部活跃人数,其中分母为any_active_event事件的触发人数 说明 any_active_event为系统预置事件,详情请参见跨端预置属性。 | 查看新功能上线后活跃用户的使用占比情况 |
人均次数(PV/UV) | 即 pv/uv,事件的人均发生次数 | 统计用户播放视频的人均次数:pv/uv |
全活跃用户人均次数(PV/AU) | 事件触发总次数/全部活跃人数,其中分母为any_active_event事件的触发人数 | 查看新功能上线后活跃用户的人均使用次数情况 |
按…求和(SUM) | 按事件的数值型属性求和 | 统计视频播放的总时长:sum(video_play_duration) |
按...求最大值(MAX) | 某属性的值的最大值,只支持数值型属性 | 看视频播放时长的最大值 |
按...求最小值(MIN) | 某属性的值的最小值,只支持数值型属性 | 看视频播放时长的最小值 |
按…求平均值 | 某属性的值之和/事件发生次数,只支持数值型属性 | 统计视频播放的平均时长:sum(video_play_time)/pv |
按…求人均值 | 某属性的值之和/事件发生人数,只支持数值型属性 | 统计视频播放的人均时长:sum(video_play_time)/uv |
按...求全活跃用户人均值 | 某数值型属性的值之和/全部活跃人数,其中分母为any_active_event事件的触发人数 | 统计活跃用户的视频播放的人均时长:sum(video_play_time)/全部活跃人数 |
按…求分位数 | 即把单位时间范围内的数据按从小到大排序后,求处在某一分位上的数; | 查看每日用户发生目标事件(此处为看视频)的次数分布情况 |
按…求去重数 | 即对事件参数进行去重统计 | 统计播放视频事件中播放过的视频数 |
按…和用户去重 | 即对事件参数和做过该事件的用户进行去重统计 | 统计用户看过的视频个数总和 |
使用事件分析工具前,您可以先浏览事件分析工具界面,了解主要功能模块,事件分析功能界面由以下部分组成。
界面示例 | 页面模块简介 |
|---|---|
|
|
事件分析工具的使用流程和各个模块的详细使用指导可查看下文详细介绍。
登录并进入DataFinder控制台后,在顶部选择选择分析工具>高级分析>事件分析,进入事件分析工具页面,然后选择要分析的目标事件和统计指标,操作步骤如下。
说明
选择过滤条件的时间属性值时,当前界面下拉框中最多支持展示1000个属性值,如果您的属性值超过1000个且需要使用的属性值不在下拉框中被展示出来,您可以通过搜索的方式查找并选择对应的属性值。
注意
事件指标+公式指标+自定义指标最多添加50组。
详细操作说明如下。
注意
添加自定义指标后,对后续查询分析的结果图表有以下影响:
注意
当前私有化5.2.0版本开始支持公式指标功能。
详细操作说明如下。
说明
不支持指标嵌套,即已保存的指标再次出现在另一个保存的指标中。如保存的自定义指标未在下拉的指标列表出现,请在指标管理页面检查是否存在不关联的指标嵌套。

细分筛选主要是用来进行用户的过滤筛选,确定需要分析的是符合哪些条件的用户。例如,筛选「城市是东营、商丘,用户分群为测试」的用户进行对应指标的分析。
配置属性分组后,后续查询分析的结果图表会按配置的各个属性取值的维度进行分组展示,便于进行更加精细化的分析。
例如,分析某个APP不同系统版本的日活用户数分布情况时,您就可以将日活用户数指标按APP的“系统版本”这一属性进行分组展示。配置示例可参见【属性分组】查看不同系统版本下的日活用户数据。
操作指导如下。
注意
属性分组支持按照事件属性、用户属性、用户标签等进行分组,一共最多支持20层分组。
更多关于属性分组的详细功能说明请参见属性(自定义)分组与属性。
完成上升指标和细分筛选、属性分组的配置后,您可查看对应指标的分析结果的可视化图表,并根据需求进行调整。
默认情况下,系统会自动以折线图的方式展示过去7天的统计结果。您可以根据需求对分析图表进行以下调整:
设定分析的时间粒度:5分钟级、小时级、天级、周级、月级;
可通过日历组件进行快捷设定分析时间段和自定义时间段;
快捷设定时间说明
粒度 | 快捷设定分析时间段 | 过去N.. | 最新(今天、本周周、本月等) | 次新(昨天、上周、上月等) |
|---|---|---|---|---|
5分钟 | 今天, 昨天 | 天 | 今天 | 昨天 |
小时 | 今天, 昨天, 本周, 上周 | 天 | 今天 | 昨天 |
天 | 今天, 昨天, 本周, 上周, 本月, 上月,今年,去年 | 天 | 今天 | 昨天 |
周 | 本周, 上周, 本月, 上月,今年,去年 | 天 | 今天 | 昨天 |
月 | 本月, 上月,今年,去年 | 天 | 今天 | 昨天 |
自定义设定时间说明:具体时间至昨天、今天、n天前;n天前至昨天、今天、n天前。
可进行时间的对比的选择:上一周期、上同周期、去年同期、自定义时间;
日期 | 含义 |
|---|---|
上一周期 | 首尾相接的上一段时间 |
上周同期 | 向前平移一周,每周顺序对应。 |
上月同期: | 向前平移一月,每月顺序对应,考虑到每个月天数不一致,无法直接平移一个月,因此不支持该选项。 |
去年同期 | 向前平移一年,相应月份和日期对应,具体策略为:直接改变年份,然后用对比时间的结束时间减去被对比时间的时间区间,得到对比时间的开始时间即可。 |
事件分析当前支持为您展示:折线图、堆叠图、柱形图、双轴图、环形图、百分比图、指标卡。您可按需切换图表类型。
折线图可便捷的用于分析趋势类的数据,是最常见的分析图表之一。
堆叠图特别适用于需要同时观察整体趋势和组成部分随时间的演变的分析需求。它结合了面积图的趋势表现力与堆叠图的结构分解能力。
柱状图的指标说明如下。
说明
如果您希望查看对照组和日期对比的柱状图,请使用“堆叠图”图表样式查看。
当事件分析多指标或多分组值时,可使用双轴图,并支持配置双轴展示细节。
环形图适用于展示各类别在整体中所占的比例的分析场景。
百分比图适用于跨时间/分组的构成比例变化的分析场景。
支持将某个指标的分析结果使用指标卡的形式进行展示,除了指标结果数据外,支持灵活勾选在指标卡中展示指标的同环比数据、累计值、平均值等数据。
说明
当有多个指标时,当前暂不支持使用指标卡来展示。
展示统计结果的详细数据表。
详细数据表支持以下操作:
如果您希望对已查询到的数据进行进一步的深度分析/数据校验,当前支持:
图表中 | 详细数据中 |
|---|---|
点击右上角的「保存到看板」,可以将需要长期监测的指标图表添加到看板中。
参数 | 配置说明 |
|---|---|
图表名称 | 可以对图表进行重新命名,便于后续查看。 |
保存位置 |
|
图表类型 | 选择保存的图表类型。当前事件分析支持将查询结果图表保存为折线图、堆叠图、柱形图等多种类型的图表,您可根据后续看板查看数据的需要,选择保存为哪种图表。 |
同时展示 |
例如,选择了一个指标本双周新增用户数通过指标卡展示后,希望也看到具体环比、同比变化,此处选择后,后续保存至看板时即会同时展示对应的数据,如图所示。 |
例如筛选最近7天(不含今天)的新用户数时,配置示例如下:
您可以使用DataFinder的预置属性:是否首日访问(推荐)、是否新用户、激活时间(SaaS-云原生、私有化)/注册时间(SaaS-非云原生)来过滤指标事件。
说明
更多关于是否首日访问($is_first_day)、新老用户(user_is_new)的介绍请参见DataFinder服务端生成。
示例场景与分析目标
某产品页面的访问链接有domain1、domain2、domain3、……多个链接,当前希望分析每个访问链接的访问用户数在总访问用户数中的占比。
配置示例
公式指标配置示例 | 分组配置示例 |
|---|---|
配置说明: | |
能看到不同版本下的数据情况,会以从高到低排序展示。与此同时还能看到上报的格式是怎么样的,展示原始上报的属性值字段。下图就是「系统版本=X.X.X」。
在进行趋势分析时,数据的异常波动对于我们发现业务上的问题或机会有重要的提示作用。我们常常会基于经验判断波动是否正常,但常常会忽略一些看似正常,但并不符合波动规律的数据。通过异常诊断我们可以快速发现这些异常数据并展开常用的维度,可以很好的帮助业务人员定位数据波动的原因。
功能激活
当事件分析中事件和对照组的乘积不超过10(如2个事件*对照组5个=10个 可用,事件3个&对照组4个=12个 不可用)并且图表类型是折线图时,会激活“异常诊断”功能。
图表类型 | 事件数量(含自定义指标) * 对照组数量 | 事件属性 + 公共属性分组 |
|---|---|---|
折线图 | <= 10 | 无 |
如下图:
图表区说明
异常诊断功能激活后,系统会取回溯天数内的数据进行计算,预测拟合出当前查询时间范围内的数据并以虚线显示在图中。虚线背后颜色较浅的色带表示符合预期的数据范围,色带的宽度由“置信区间”来决定。置信区间数值越大,表示宽容度越高,则更多的实线上的实际数据就会出现在色带范围中,而那些没有出现在色带范围内的实线上的数据点,则会被标记为“异常”点,以红色高亮显示,可以通过显微镜功能进入异常数据的纬度展开。
如下图:
参数设置
可以在下拉菜单中配置置信区间和回溯天数,如下图:
含义 | 取值区间 | |
|---|---|---|
置信区间 | 包含在阈值范围内的数据占全部数据的比例 | 80%-99% |
回溯天数 | 早于所选开始日期的天数,选择足够的天数以便计算更贴合实际情况的阈值范围。 | 至少一个当前所选的日期范围至365天。 |
说明
“置信区间”100%时代表所有的真实数据点都不是异常。
异常标签
激活异常诊断后,数据点的提示框中会出现预测值以及预测的区间值。如果悬停的数据点刚好存在异常,提示框中会出现“异常”标签。
显微镜功能及开启异常诊断
目前异常诊断功能为BETA版,仅支持单一指标进行诊断;如果您使用有任何建议和反馈,欢迎给到我们反馈。


说明
* 在没有通过显微镜点击进入异常诊断前,异常诊断中不会显示数据; * 在维度明细中会罗列查询指标数据异常中,“参考值”和“实际值”包含的所有属性属性维度,每页默认会展示20个纬度,也可以在右下角位置进行重新设置展示的条数(如下图)。


说明
* 搜索:可以搜索指标的属性维度; * 指标:事件分析中选择的指标; * 参考值:期望值; * 实际值:异常点实际数据; * 差异:实际值和期望值之间的差异。

