You need to enable JavaScript to run this app.
导航
用户分群常见问题
最近更新时间:2025.10.14 16:38:22首次发布时间:2025.10.14 16:38:22
复制全文
我的收藏
有用
有用
无用
无用

分群规则

Q:CDP 对已经命中标签规则的人群,需要手工剔除个别用户,如何实现?圈选分群如何剔除指定的ID?

可以将ID上传为一个人群包,在圈选分群的时候不包含「上传的人群包」。

Q:目前产品支持几种创建私域人群包的方式?

支持规则创建、上传创建、模型创建(Lookalike)三种方式。除此之外,洞察导出以及复制已有人群包并创建新人群包的方式等也可以新建人群包。

Q:如何理解创建人群包时的“精准预估”?

在创建人群包时,如果选择ID是基准ID,将根据圈选条件预算预估数量;当选择的ID非基准ID时,可以通过精准预估,系统将根据ID mapping将当前ID转换基准ID,并计算出预估数量。
注意:

  • 当选择基准ID时,可秒级计算出预估数量。
  • 当选择非基准ID时,百万级别1s内,千万 级别10s内,上亿级别1min内。

Q:规则创建人群包时,“包含”“不包含”“全局不包含”“包含全部”分别时什么意思?

圈选逻辑

解释

包含

将圈选出被打上该标签且标签值符合选项的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签包含 “是”,即选中4人。

包含全部

将圈选出被打上所选择的所有标签值的用户
举例:小a的兴趣标签值是短视频,体育和娱乐;小b的兴趣标签值是体育。
分群圈人的时候,圈兴趣爱好标签“包含”体育时,那么小a和小b能被圈到
圈兴趣爱好标签 “包含全部” 短视频和体育,那么只有小a能被圈到

不包含

被打上该标签且标签值不包含选项的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签不包含 “是”,即选中6人。

全局不包含

在全量用户(含未被打上该标签的用户)排除该标签值的用户
举例:如果全量用户100人,其中10人被打上“是否老年”标签:其中“是”4人、“否”5人、“其他”为1人。 那么选择该标签全局不包含 “是”,即选中96人。

Q:Lookalike创建分群的逻辑?

如果是固定人数的话,lookalike计算的时候会给每个人计算概率值,然后根据概率值排序取top n的人数变成人群

Q:分群是存储在 clickhouse 中吗?

每个分群结果是以位图(bitmap)模式存储在clickhouse的

Q:多维特征分析中的召回率和精确率分别指的是什么

召回率:正样本中满足该筛选条件的特征组合人群,在总体正样本中的占比。比如,正样本中满足该特征的人群为100人,全体正样本为1000人,则召回率为(100/1000)*100%=10%
精确率:正样本中满足该筛选条件的特征组合人群,在正负总样本中的占比。比如:正样本中满足该特征的人群为400人,负样本中满足该特征的人群为100人,则精确率为400/(400+100)*100%=80%

Q:子分群包下的人群是增量用户新增的机制,还是存量用户也会更换?

人群包更新都是每次重新计算。不会增量更新。

Q:分群创建和预估时依赖的数据规则分别是怎样的?

分群创建和预估时的数据规则如下:

  1. 分群预估:依赖的是当前使用的资源(标签/分群/属性)的最新分区。在非baseid的预估场景中,使用的计数函数为uniq(),这可能会带来大约0.1%到0.2%的误差。
  2. 分群创建:分为两种情况:
    • 按需人群:直接开始任务,使用的是当前使用的资源的最新分区数据。
    • 按天人群
      • 第一次创建时,与按需人群相同,使用最新分区数据。
      • 后续按天运行时,如果配置了任务依赖,则依赖的标签/人群产出时使用对应资源的当天产出数据。
      • 如果未配置任务依赖,则与按需人群相同,使用最新分区数据。

Q:人群包拆包是什么逻辑?

人群包拆包是根据比例随机将用户分到对应的分群包下的。

Q:人群包下载在VeCDP平台有什么样的限制?

VeCDP人群包下载没有条数限制。下载文件的大小限制大约为2G。如果文件大小超过2G,下载可能会失败。

Q:实时分群选不到Finder行为表。Finder离线表怎么转成实时表? 同时购买了Finder和CDP,希望将Finder行为数据接入CDP做实时应用,finder属性表是否支持作为实时数据档案?

  1. CDP1.22版本开始,如果客户开了实时功能的话,数据档案中Finder行为表-更新频率字段 会有个刷新按钮,点击下这个按钮就可以将离线的Finder行为表转为实时的行为表了。点击没有风险,可以直接操作(注意:转实时数据源后 不支持还原为离线,不影响使用)。

Image

  1. 标品不支持自动将Finder属性表 自动转换为实时数据档案,需要ETL单独配置开发。

Q:怎么跨主体圈选特定时期购买具有某些特征的商品的用户?

场景描述:客户需要根据商品的材质和品牌圈出商品,之后找出某一特定时间段购买这些特征商品的人。
解决方案:建议客户新构建一张主体转换关系表,假设原始表是明细表,通过加工明细表过滤出最近1年的交易记录,之后筛选出用户和商品的关系字段,包含两个字段用户的会员ID和商品ID,生成hive全量表,添加到主体转换关系中。之后通过商品圈选,然后选择新建的这组转换关系,将商品ID转换成用户ID。
Image

Q:CDP如何删除隐藏分群?

在如下图中位置连续点击,可以触发显示「隐藏分群显示按钮」
Image
然后可以通过分群包id或分群名称,检索出该分群进行额外处理
Image

Q:CDP-Saas环境分群上传性能如何?

由于Saas环境走公共队列、Saas环境上传分群 2W 需要15分钟以内正常的。

Q:下载用户分群是否有数量限制?能否批量下载多个分群?

  1. CDP产品当前对下载的分群数量没有做限制、仅受限于对应环境网络超时配置。
  2. 当前CDP产品不支持批量下载多个分群。

故障排查

Q:为什么人群包的推送状态一直显示推送中?

人群包的推送根据包覆盖用户数不同而不同,一般来说上亿的包都是1天起步,3亿内投放量一般推送时间是1-3天,5-8亿推送一周左右,请您务必提前预留出推送时间,尤其是大促节点。若超出正常推送时间范围可以联系火山引擎技术人员。

Q:分群报错:{"code":1120100000003,"msg":"当前图谱有效日期为空,需要重新运行 ID 图谱","data":null}”?

V1.21版本上面如果新增了ID类型,上传分群的任务如果录入ID类型和生成ID类型不一致的时候,会出现任务异常;原因是分群调/identity_meta/openapi/v2/hive,meta服务报错。需要重新运行idm任务才可以,升级至1.23以及以后版本可以不用手动重新运行idm任务。

Q:lookalike报错1100000000222是什么问题?

Lookalike(相似人群扩展)功能在使用时需要满足一定的条件,其中包括分群数量的要求。所选分群的数量应该在100到全量ID数量的1/5之间,但不超过10,000,000。如果您在使用Lookalike功能时遇到了“所选分群不符合条件,分群数量应满足[100, min(10000000, 全量ID的1/5)]”的报错信息,这意味着您选择的分群数量不在这个范围内。
为了解决这个问题,请确保:

  1. 您选择的种子分群(即您希望找到相似用户的原始分群)的用户数量至少有100个。
  2. 种子分群的用户数量不超过全量ID数量的1/5,同时不超过10,000,000。
    如果您的分群数量不在这个范围内,您需要调整分群的规模,以确保它满足Lookalike功能的要求。您可以通过增加或减少分群中的用户数量来达到这个要求。