You need to enable JavaScript to run this app.
导航

分群与洞察常见问题

最近更新时间2023.05.06 17:45:01

首次发布时间2022.03.30 16:36:45

Q:目前产品支持几种创建私域人群包的方式?

支持规则创建、上传创建、模型创建(Lookalike)三种方式。除此之外,洞察导出以及复制已有人群包并创建新人群包的方式等也可以新建人群包。

Q:如何理解创建人群包时的“精准预估”?

在创建人群包时,如果选择ID是基准ID,将根据圈选条件预算预估数量;当选择的ID非基准ID时,可以通过精准预估,系统将根据ID mapping将当前ID转换基准ID,并计算出预估数量。

注意:

  • 当选择基准ID时,可秒级计算出预估数量;

  • 当选择非基准ID时,百万级别1s内,千万 级别10s内,上亿级别1min内;

Q:历史保存的洞察报告会自动更新吗?

不会,历史保存的洞察报告是创建时的结果。CDP的群体洞察支持实时出数,若要更新已经保存过的洞察报告,可以点击编辑,再次点击查询,就会用标签最新数据进行群体洞察。

Q:洞察报告模块各项指标分别是什么意思?

指标解释说明
大盘TGI名词解释展示分群包中某标签值在该项目下的显著性特征结果。>100则表示分群包具有相对倾向或者偏好,数值越大倾向和偏好越强;<100则表示相关倾向较弱(和平均相比);=100则表示平均水平。
计算公式(分群包中可识别标签值用户量/分群包用户总量)/(项目下可识别标签值用户/项目下用户总量)*100

场景举例

公司总人数为10,000人;该洞察报告中分析的人群为游戏研发部门全体员工,总计1,000人;全公司具有深度游戏爱好的员工为500人;游戏研发部门具有深度游戏爱好的员工为100人。
此时大盘TGI=(100/1000)/(500/10000)*100=200,高于100,说明游戏部门相比公司其他部门员工更爱游戏。

标签占比

名词解释

分群包中,标签值在当前分群包下的占比。
占比越高,表示在分群包中该标签的绝对人数越多。

计算公式分群包中标签值用户数量/分群包用户数量*100%
标签TGI名词解释分群包中某标签值在该标签下显著性特征结果。>100则表示分群包中标签值在该标签下更具有相对倾向或偏好,数值越大则倾向和偏好越强;<100则表示相关倾向较弱(和平均相比);=100则表示平均水平。
计算公式(分群包中可识别标签值用户量/分群包中该标签用户总量)/(项目下可识别标签值用户量/项目下该标签用户总量)*100

场景举例

公司总人数为10,000人,全公司具有深度兴趣爱好的用户为800人,深度游戏爱好的员工为500人,深度美妆爱好员工300人。
该洞察报告中分析的人群为游戏研发部门全体员工,总计1,000人,其中具有深度兴趣爱好的用户为120人,其中具有深度游戏爱好的员工为100人,具有深度美妆爱好员工20人。
具有深度游戏爱好的标签TGI=(100/120)/(500/800)*100=133
高于100,说明游戏部门更多的用户喜欢游戏。

标签有效占比

名词解释

分群包中,标签值在当前分群包下标签总人数下的占比。
占比越高,表示在分群包中该标签的绝对人数越多。

计算公式分群包中标签值用户数量/分群包中标签的用户总量*100%

Q:生命周期洞察里面的<机会人群>是什么意思?

没有在用户阶段里的人都会展示在机会人群里,可以理解为“其他”。

Q:规则创建人群包时,“包含”“不包含”“全局不包含”“包含全部”分别时什么意思?

圈选逻辑解释

包含

将圈选出被打上该标签且标签值符合选项的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签包含 “是”,即选中4人。

包含全部

将圈选出被打上所选择的所有标签值的用户
举例:小a的兴趣标签值是短视频,体育和娱乐;小b的兴趣标签值是体育。
分群圈人的时候,圈兴趣爱好标签“包含”体育时,那么小a和小b能被圈到
圈兴趣爱好标签 “包含全部” 短视频和体育,那么只有小a能被圈到

不包含

被打上该标签且标签值不包含选项的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签不包含 “是”,即选中6人。

全局不包含

在全量用户(含未被打上该标签的用户)排除该标签值的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签全局不包含 “是”,即选中96人。

Q:Lookalike创建分群的逻辑?

如果是固定人数的话,lookalike计算的时候会给每个人计算概率值,然后根据概率值排序取top n的人数变成人群

Q:分群是存储在 clickhouse 中吗?

每个分群结果是以位图(bitmap)模式存储在clickhouse的

Q:多维特征分析中的召回率和精确率分别指的是什么

召回率:正样本中满足该筛选条件的特征组合人群,在总体正样本中的占比。比如,正样本中满足该特征的人群为100人,全体正样本为1000人,则召回率为(100/1000)*100%=10%
精确率:正样本中满足该筛选条件的特征组合人群,在正负总样本中的占比。比如:正样本中满足该特征的人群为400人,负样本中满足该特征的人群为100人,则精确率为400/(400+100)*100%=80%

Q:洞察报告中业务大盘和人数分别指什么?

大盘是指的该项目下该标签值的总人数,人数是指的该人群包中该标签的人数