You need to enable JavaScript to run this app.
导航
系统字段及处理逻辑说明
最近更新时间:2023.07.13 16:50:28首次发布时间:2023.07.13 16:50:28

数据校验后的落库及归因过程中对字段进行了预置处理,具体逻辑可参考下表。

落库后的表字段及处理逻辑

表名称

新增字段名

字段说明

行为表

origin_parent_item_id

原始的 parent_item_id,用户同步的 parent_item_id 字段会经过 fnv hash 处理后覆盖原字段名

origin_item_id

原始的 item_id,用户同步的 item_id 字段会经过 fnv hash 处理后覆盖原字段名

receive_timestamp

服务器接收到数据的秒级时间戳

ts

系统默认生成的分区归档字段
增量实时数据:ts 为服务器接收到数据的秒级时间戳
增量天级别/历史数据:ts 为客户请求时 header 中携带的 YYYY-MM-DD 日期对应 0 点的秒级时间戳

page

抽取 spm 第二段作为场景 page

用户表

receive_timestamp

服务器接收到数据的秒级时间戳

ts

系统默认生成的分区归档字段
增量实时数据:ts 为服务器接收到数据的秒级时间戳
增量天级别/历史数据:ts 为客户请求时 header 中携带的 YYYY-MM-DD 日期对应 0 点的秒级时间戳

物品表

receive_timestamp

服务器接收到数据的秒级时间戳

ts

系统默认生成的分区归档字段
增量实时数据:ts 为服务器接收到数据的秒级时间戳
增量天级别/历史数据:ts 为客户请求时 header 中携带的 YYYY-MM-DD 日期对应 0 点的秒级时间戳

origin_item_id

原始的 item_id,用户同步的 item_id 字段会经过 fnv hash 处理后覆盖原字段名

归因后字段及处理逻辑

表名称

新增字段名

字段说明

行为表

att_is_dup

去重标记,0:非重复,1:重复

att_trace_id

归因生成 trace_id

att_traced

归因标记,0:归因失败,1:归因成功

att_father_bhv_type

归因父节点行为,多个用$##$拼接

fake_context_id

mock context_id 字段

_final_request_id

内部生成 request_id 字段用于样本拼接,如果客户数据中同步 request_id 且不为空则为 request_id 值,否则根据
user_id、req_time、spm、parent_doc_id 拼接生成,其中 spm 取前三段

origin_{}

数据预处理去重功能中,对于高级聚合的字段会将去重前的原始字段保留到 origin_{} 字段

att_origin_{}

数据预处理归因功能中,对于要归因的字段会将归因前的原始字段保留到 att_origin_{} 字段

req_time

bhv_time 归因后的字段名,原 bhv_time 字段值不变

用户、物品表

_create_time

用户/物品 ID 创建的时间

_update_time

用户/物品 ID 更新的时间

_final_update_time

coalesce('update_time', 'ts'),用于上传 tbase 指定写入的时间戳信息,避免批流数据写入覆盖

_err_fields_case

数据校验异常字段 case 信息