You need to enable JavaScript to run this app.
导航

单主体ID-Mapping配置

最近更新时间2024.03.28 11:23:41

首次发布时间2024.03.28 11:23:41

1.功能概述

通过VeCDP-ID图谱构建功能,可以基于用户ID、手机号、设备号等ID信息,关联起同一用户多个账号的碎片化数据,整合企业多方数据,帮助营销或运营人员识别不同渠道的同一用户,实现精准营销及精细化运营。

2.使用限制

仅集团管理员(即admin账号)可以配置ID图谱。

3.应用场景

单主体的场景下,大部分时围绕“用户”这一主体进行ID识别和打通,常见场景如:

  • 跨平台用户识别:用户可能在不同的设备(如PC、手机、平板)上使用同一服务,ID-Mapping可以帮助企业识别这些设备背后的同一用户,从而提供无缝的跨设备体验。

  • 营销活动优化:通过ID-Mapping,企业可以更准确地了解用户画像与显著特征,结合属性、订单、行为数据综合分析用户偏好,优化营销策略,实现精准广告投放,提高转化率和用户参与度。

  • 个性化推荐:结合用户属性、订单、行为数据洞察用户画像,帮助企业为用户提供更加个性化的内容推荐,增强用户体验。

4.名词解释
名词解释说明
One ID又称BaseID或基准ID,是主体的唯一身份ID。
主体又称实体/对象,常指可被运营增长或洞察分析的人/车/场等。
ID代表一个主体的一串序列号,例如手机号。
ID类型定义主体身份的数据信息,常指用户ID、设备ID等跟随主体的特定标识,可以理解成身份ID。
ID标识CodeID的唯一标识,可用英文+下划线的方式进行定义。
ID数据类型底层数据类型,默认可选择字符串型。
渠道识别标识用于标记可被下游识别的官方类型,如手机号Phone/IDFA等。
数据集在ID图谱构建模块,特指离线全量ID的数据集,目前仅可选Hive类型数据集。
全量更新每天读取最新分区数据更新数据 P_date(日期分区) = 最新一天。
增量更新每天读取历史全部分区更新数据 P_date(日期分区) <= 最新一天。
多主体转换关系通过配置多主体间的关系数据及转换策略,构建转换关系,常用于推荐、撮合及数据互通场景,如通过车的标签数据找到车对应的潜在客户信息。
5.操作指南

5.1 第一步:配置主体

说明

作用:定义一个全新的主体对象,又称实体/对象,常指可被运营增长或洞察分析的人/车/场等
结果:围绕每个主体会生成一套OneID数据内容,OneID(又称BaseID/基准ID)为主体的唯一身份ID

操作步骤如下:
1.点击 数据管理-ID图谱构建 。
2.选择 新建主体 按钮,并填写主体对应信息,包括:

  • 主体名称:主体可被理解识别的命名,如人/车。

  • 主体描述:主体可被详细理解的描述,如使用xx的用户表示人。

  • 主体类型:用于区分主体的分类标识,如人、车、店铺、商品等。

  • 主体头像:将根据选择的主体类型展示默认头像,此处头像会在主页及个体画像中展示标识。

5.2 第二步:配置ID类型

说明

作用:用于定义唯一主体的身份标识,包含标识的元信息及全部标识的数据
结果:用于OneID生成的最基础数据来源,理论每个ID需配置包含全部用户的数据(全量ID数据)

操作步骤如下:
1.点击主体后的 配置 按钮。

2.配置ID类型。在该页面中,点击 新建ID类型 ,在ID配置页面填写对应信息:

  • ID类型:单独一个ID还是多个ID组合而成,单一ID/组合ID。

  • ID名称:用于表示ID的命名。

  • ID描述:用于区分理解ID的描述信息。

  • ID标识Code:ID的唯一标识,可用英文+下划线的方式进行定义。

  • ID数据类型:底层数据类型,默认可选择字符串型。

  • 组合ID高级配置:通过维表来定义ID1可选的维度名称,用于圈选时进行分类选择,不会参与OneID的生成,如 App_ID + Uid构建组合ID,此时App_name可通过维表映射获得。

  • 渠道识别标识:用于标记可被下游识别的官方类型,如手机号Phone/IDFA等。

  • 是否加密:打开后,「用户分群」及「个体画像」将显示或下载加密结果。

  • 是否配置数据:开启后,可配置ID的全量数据源,配置完成后该ID才可在下一步「OneID配置」配置。

  • 数据来源:

    • 离线+实时数据:可同时配置离线全量数据和实时数据,相互修正。

    • 仅实时数据:无需配置离线数据,实时数据可通过「可视化建模」实时IDMapping算子实时生成OneID。

  • 数据集:离线全量ID的数据集,目前仅可选Hive类型数据集。

  • 更新方式:支持全量、增量更新两种方式。

  • ID类型对应字段: 该ID对应数据集中的字段。

5.3 第三步:配置OneID

说明

作用:通过ID的优先级及ID间的参考关系定义OneID的生成逻辑,是OneID最核心的配置
结果:最终产生符合标准的OneID数据

5.3.1 离线One ID生成策略

操作步骤如下:
1.点击 数据融合-ID图谱构建-OneID配置 ,进入 离线One-ID生成策略 的配置页面;
2.选择合适的 OneID生成算法,目前支持 增强分段算法复用原有ID。

  • 增强分段算法 即在分段算法的基础上进行算法计算强化,在ID数量不唯一且用户量级在千万以上时推荐使用该算法;

  • 复用原有ID 即直接读取ID数据源去重结果作为OneID,如自身已有OneID产出无需二次加工,可选择“复用原ID”。注意:由于OneID系统约定使用数值类型数据,如非数值类型ID数据,生成的OneID均为0。


3.配置OneID识别参考关系。点击 添加参考关系 (注意此处配置的参考关系,只有在ID优先级中选用了才会生效),包括:

  • 关系数据集:构建参考关系的数据来源,往往是包含两个ID的映射维表数据集,目前仅支持Hive类型的数据集。

  • 日期分区字段:关系数据集中的日期分区字段。

  • 日期分区格式:分区字段对应的内容格式,支持yyyyMMdd、yyyy-MM-dd。

  • 更新方式:支持全量、增量更新两种方式。

  • 构建关系的ID:基于数据集建立ID间的参考关系,先选ID再选ID对应数据集的字段。

  • 参考策略:ID间相互参考时,如存在参考ID是一对多的关系,为了参考最合理的ID对应的BaseID,则需要指定策略字段和策略逻辑,如不配置则采用系统默认策略。如「设备ID」参考「手机ID」时,数据上存在一个设备ID对应多个手机ID,此时可设置 最新 使用时间 的手机ID作为参考的手机ID,此时使用时间为策略字段,最新为策略逻辑。


4.配置ID优先级,即定义ID参与OneID生成的优先级顺序,按照优先级顺序依次参与生成OneID。支持用户通过拖拽的方式调整ID的优先级顺序。

  • OneID强制一对一:限制该ID的原始ID与最终OneID绝对一一映射,开启后不受参考关系影响。

  • OneID是否可变:限制该ID对应的OneID一旦生成后是否会发生改变,开启后将根据最新的优先级或参考关系改变。

  • 离线参考实时结果:限制实时产生的OneID是否需要离线进行修正,开启后,离线将直接参考复用实时产生的OneID;注:如ID的数据源仅实时数据,则该开关默认开启且不可关闭。

  • 参考关系:点击配置,可以配置该ID与其他ID的参考关系(此处仅可选择已配置的One ID识别参考关系,并且需要设定参考关系的优先级)。

  • 操作:支持删除当前ID,但已参与OneID生成,不可删除。

5.3.2 实时OneID生成策略

说明

按照以下操作配置实时OneID生成策略后,用户就可以在可视化建模中使用实时ID- mapping算子生成实时OneID。

操作步骤如下:
1.点击 数据融合-ID图谱构建-OneID配置 ,进入 实时One-ID生成策略 的配置页面;
2.选择合适的 OneID生成算法,目前支持 增强分段算法复用原有ID。

  • 增强分段算法 即在分段算法的基础上进行算法计算强化,在ID数量不唯一且用户量级在千万以上时推荐使用该算法;

  • 复用原有ID 即直接读取ID数据源去重结果作为OneID,如自身已有OneID产出无需二次加工,可选择“复用原ID”。注意:由于OneID系统约定使用数值类型数据,如非数值类型ID数据,生成的OneID均为0。


3.配置ID优先级,当实时行为数据流中同时存在多个ID类型,将根据优先级顺序优先查询或生成高优先级ID类型对应的OneID,然后根据强制一对一规则判断OneID是否可以复用。

  • OneID强制一对一:限制该ID的原始ID与最终OneID绝对一一映射,开启后不受参考关系影响。

说明

示例: 如实时数据中同时存在用户ID/设备ID,用户ID优先级高于设备ID,用户ID到BaseID设置强制一对一

  1. 先看用户ID是否生成过OneID (触发优先级规则)
    1. 如果生成过,则将用户ID的OneID作为实时流中用户ID及设备ID的共同OneID

    2. 如果没有生成过,然后再根据优先级看设备ID是否生成过OneID (触发优先级规则)

      1. 如果设备ID生成过,再看OneID是否绑定过其他用户ID

        1. 如果绑定过,则OneID无法被此数据流复用,重新生成一个新的OneID作为该条实时流的OneID (强制唯一规则)

        2. 如果没有绑定过,则OneID可作为该条实时流的OneID

      2. 如果设备ID未生成过,则新生成一个OneID作为该条实时流的OneID


4.配置实时数据上报渠道,支持的渠道包括:实时可视化建模、DataFinder、分群上传,开启对应渠道后,通过该渠道上报的实时数据将会参与OneID生成。

说明

多渠道同时上报时,根据上报的顺序参与OneID生成。

  • 实时可视化建模:消费实时数据,实时生成OneID,根据一个流内的ID及此处的优先级顺序依次生成OneID;

  • DataFinder上报:同时购买了DataFinder时,系统自动添加,DataFinder上报时会自动产生OneID,实时行为数据的全域打通;

  • 分群上报:开启后,分群中纯新的ID会直接生成新的OneID。

注意

  1. 分群上报数据参与One ID生成的功能非默认功能,如需要使用请在部署时开启;

  2. 由于该渠道上报数据的入口涉及的用户较多,可能上传脏数据导致OneID会乱,该渠道注意谨慎开启,开启后一旦产生脏数据暂不支持系统删除修正。