You need to enable JavaScript to run this app.
导航
首页及标签常见问题
最近更新时间:2024.10.22 16:17:17首次发布时间:2022.01.07 14:43:47

Q:为什么在CDP中使用相同的标签类型,离散值展示和区间划分的结果不一致?

运算标签按区间划分、运算结果默认保留两位小数,如果按统计值划分,指定了保留小数位不等于两位,则可能因为小数点保留精度不一致导致数量差异。

Q:标签描述最大字数多少

标签描述最大支持500个字符。
Image

Q:首页自定义看板中指标卡上展示的值是怎样的统计逻辑?

对于离线标签,系统默认显示与前日此时、前日综合相比之下的指标表现情况。 对于实时标签,系统自动显示与昨日此时、昨日综合相比之下的指标表现情况。
举例如下:
离线标签:假设今天是3号,指标卡的值是2号的数据,前日此时和前日综合都是1号的数据 实时标签:假设今天是3号,指标卡的值是3号的数据(每小时计算一次),昨日此时是指到2号此刻的统计值,昨日综合是指到2号结束的统计值

Q:数据资产看板中,关键业务指标的计算逻辑是怎样的?

关键业务指标展示的数据,与所选择的截止时间相关,截止时间如果选择当天,则默认展示昨天的数据;如果选择截止时间是过去1天,则展示的是所选日期的数据。

Q:为什么标签预览页面的【标签人数分布】没有展示所有标签值?

展示该标签下不同标签值最新时间分区的人数分布,当标签枚举值过多时,至多展示30个标签值的人数分布。

Q:标签人数分布下的各标签值分布相加大于100%是为什么?

多值标签的标签值分布占比相加可能大于100%,以兴趣标签为例,一个人可能存在多个兴趣值。

Q:创建生命周期标签时,若同一个用户同时满足多阶段的规则怎么办?

设置生命周期标签的时候,可以设置标签值的顺序,满足多个阶段归为后面阶段。
*即:用户分层倒序,同一用户会按照阶段倒序匹配

Q:在构建标签及圈人群包时, CDP支持哪些类型的日期筛选?

支持固定日期、动态日期、单个日期及高级日期选择。
1)固定日期选择: 支持选择某一天或一段日期,如2022-01-03~2022-01-03,或2022-01-04~2022-01-13。
Image
2)动态日期选择: 支持选择以今天为基准的一段时间,如最近1/3/7/14/30天、本双月/月、最近3/6月、最近1/2年,或者自定义最近X天(是否包含今天)。
Image
3)单个日期选择: 支持点选某单个日期,如2022-01-12。
Image
4)高级日期选择: 以当前时间为基准的一段时间,如未来7天内(含今天)、过去7天前(含今天)、未来7天后(含今天)、过去2天前-过去4天前等。 产品能力上支持:

  • 开始时间:固定/动态/无限制+(x)天/小时/分/秒/周/月/年+前/后
  • 结束时间:固定/动态/无限制+(x)天/小时/分/秒/周/月/年+前/后

Image
仅行为数据支持以事件发生时间为基准的一段时间,如注册时间在xx事件发生的当天/当周/当月、注册时间在xx事件发生的未来/过去3天/秒/分/小时/周等。
Image

Q:CDP中的实时标签,如果依赖的数据源更新后,反应到标签值的更新速度是怎样的?

秒级更新

Q:标签体系支持多少层级?

目前CDP的标签体系支持4层级

Q:多值型的标签值仅支持文本型的吗?

目前是的,后续偏好标签会支持多值文本、多值日期、多值数值。

Q:规则标签的包含全部和包含、全局不包含是什么意思?

包含:有一个标签值即可;
包含全部:所有标签值都要有;
比如选择3个值,包含就是命中其中1个就行,全部包含是3个值都要命中。
标签类型是string, DecimalEnum, StringEnum 和Date的时候有全局不包含,比如值类型是float,double,int,到圈人组件里就是Decimal

Q:为什么全量标签覆盖率显示大于100%?

产品逻辑为当前的全量标签覆盖数与前一日更新的覆盖数做对比,形成覆盖率,超出100%的比例为当天实时标签增长的数量

Q:创建账号后该账号有查看标签的权限但无法看见标签具体的覆盖数?

需要给角色/用户组授权对应的行权限,用户才能看到被授权的覆盖数

Q:TGI 和 CTR 代表什么意思?

TGI 是点击人群该标签值占比/对照人群该标签值的点击占比,结果与 100 相差越远,说明该特征值越显著;CTR 是人群包中点击 Push 人数/人群包接收到 Push 人数,结果数值越大,说明该特征越明显。

Q:标签显示执行成功,但是没有数据是什么原因?

Image
可以先看下耗时,如果时间很短的话通常是因为上游建模任务依赖的Hive表数据未就绪建模任务就运行完毕导致的,CDP这边自定义SQL需要我们手动在【输出节点】创建依赖关系,创建后上游数据没有准备好这个建模任务会显示「等待上游就绪」相应的下游的标签任务也会显示「等待上游就绪」。配置的方式是在可视化建模任务中点击编辑-添加输出节点-依赖配置选择相应的表,自定义sql涉及的表都需要增加上。

Q:创建标签时,依赖的数据规则是什么?

  • 创建规则标签时,依赖的数据规则是取依赖标签的最近有数的一天。例如,如果23号创建标签,而最近的运行成功日期是21号,那么预估人数将取21号的标签数据。
  • 运算标签的依赖规则是依赖近一天的数据。具体来说,当天的运算标签读取的是上游标签的前一天的数据。这意味着运算标签和它引用的上游标签的业务日期是相同的。

Q:SQL标签制作多值标签时怎么对标签数组去重? Clickhouse SQL 怎么对数据进行去重?

可以使用 arrayDistinct() 函数对数组进行去重,下面是一个示例:
Image

Q:全量标签覆盖率为什么会超过100%?

Image
全量标签覆盖率超过100%是因为全量标签默认以T-1天的离线全量数据作为基准。如果有实时数据进入系统,就会展示超过100%的用户占比。出现这种情况是因为全量标签是实时更新的。当天进入系统的base_id会被计入,因此,多出来的部分是当天实时进入的数据。

Q:在使用标签体系功能模块时,需要关注哪些产品限制?

使用标签体系功能模块时,需要关注以下产品限制:

  • 导入标签创建时,数量最多限制为30个。
  • 人工标签上传文件的大小和行数限制,最多为100万行。
  • 批量上传事件属性时,单次上传不能超过500条。
  • 标签值卡片有限制,生命周期内最多8个。
  • 标签树的层级限制,最多为4层。
  • 标签分布展示时,枚举值最多可展示30个,且页面可配置。
  • 创建标签时,下拉枚举值条数限制最多为1000个。
  • 明细表和行为表不支持array类型的数据。
  • IDM配置最多20个ID。

Q:客户咨询其他这里,哪些状态会放在其他?实时标签和人工标签么?

【其他】包含实时标签、人工标签,以及异常状态(非运行中、等待就绪、成功、失败)的离线标签

Q:创建客群,规则中有3个标签,配置了依赖。创建人有行权限,行权限的标签是分行,分群是否同时依赖规则中的标签和行权限的标签的任务?

创建客群,规则中有3个标签,配置了依赖。创建人有行权限,行权限的标签是分行,分群是否同时依赖规则中的标签和行权限的标签的任务
分群如果是自动按天调度的话,需要配置分群依赖里面配置了依赖标签,运行的时候会依赖标签,不会依赖行权限标签。手动运行分群,不依赖任何标签,取最新有数的一天。

Q:客户之前有个导入标签,由于上游的属性数据存在重复的baseidID,导入失败,提示baseid重复。之后客户又使用了一个有重复baseid的属性数据做了一个导入标签,发现可以成功,这是为什么?

CDP可以配置使用源表进行导入,不做baseid重复的校验。可以通过 profile_meta环境变量:USE_ORIGIN_TABLE 进行配置打开使用源表的开关。打开使用源表的开关后,CDP每个项目下支持2个属性表使用源表数据,默认是按照创建先后顺序的前两个默认开启使用原表进行导入。之后的其他属性数据使用的是非原表的属性表进行导入,导入时会检查 baseid 是否重复,如果baseid 重复,就会导入失败。

Q:日期和非日期的标签在选择历史日期时的计算规则差异?

逻辑为使用历史日标签逻辑为先找该历史日的分区,再查询该分区中的数据。日期型标签现阶段不能使用历史日实现客户需求(取上月末近一天),会和产品提相关需求规则标签和生命周期标签

Q:规则标签和生命周期标签的命中逻辑异同是什么?

二者都不允许取多值(即:某个体命中A标签值,将不会再次命中B标签值)
规则标签的命中顺序按照标签值tab从左往右依次检验。
生命周期标签的命中顺序按照标签值tab从右往左依次检验。

Q:多值型标签值可以通过以下方式创建?

  1. import(导入):通过导入数据文件来创建多值型标签,文件中包含用户ID和对应的多个标签值。
  2. manual(人工):手动创建多值型标签,通常在用户界面中直接输入或选择多个值。
  3. logic(逻辑):使用逻辑表达式来定义多值型标签,例如,根据用户的行为或属性组合多个值。
  4. hive_sql(Hive SQL标签):使用Hive SQL查询来生成多值型标签。
  5. clickhouse_sql(ClickHouse SQL标签):使用ClickHouse SQL查询来生成多值型标签。
  6. 偏好(preference)。

Q:字典更新后标签详情页面未自动更新是什么问题?

  1. 标签上游更新后,导入标签任务不会自动更新、需要重跑标签任务。
  2. 如果数据源字典更新,标签体系页面由于缓存无法及时更新(缓存周期一般为7天),可以通过重跑任务的方式快速完成刷新。

Q:两个主体下的标签不能重名吗?

标签名称项目下唯一,在同一项目下两个主体下的标签名称依然不能重复。

Q:CDP的标签都有哪些类型?

标签类型名称

mysql中对应的标签类型
(cdp.cdp_label_base_info.label_type)

1-规则标签

rule

3-导入标签

import

4-人工标签

manual

6-逻辑标签

logic

7-组合标签

combine

8-机器学习模型标签

ml_model

9-数据清洗模型标签

etl_model

10-clickhouseSQL标签

clickhouse_sql

11-hiveSQL标签

hive_sql

12-多阶段标签

multi_stage

13-rfm标签

rfm

14-统计标签(CDP1.10)

statistics

15-首末次标签(CDP1.11)

first_last

16-智能外呼标签(CDP1.13)

17-偏好标签(CDP1.14)

preference

18-行业模型标签(CDP1.14)

industry_model

128-全量标签

mautag