You need to enable JavaScript to run this app.
导航
数据档案管理
最近更新时间:2025.07.11 15:00:25首次发布时间:2022.11.24 17:38:00
复制全文
我的收藏
有用
有用
无用
无用

1. 功能概述

在数据档案管理功能模块,支持将 底层数据 按照不同业务类型和格式注册管理成 业务可读可理解的业务数据内容,下游应用可以根据约定的格式高效调用数据,业务可以根据重定义的命名和解释快速理解数据,实现数据的快速识别应用。

2. 注意事项
  • 管理员 及具备 项目中心-模块-数据档案管理-查看或增删改数据档案 权限的人,才可以使用该模块。
  • 建数据档案前需在可视化建模中完成数据集的清洗与关联One ID的配置,只有包含One ID及分区字段的数据集才可以在该模块进行注册。
  • 只有在数据档案管理中完成登记的数据,才可以被用来进行后续的标签创建、群体圈选等。

3. 数据档案格式要求

3.1 主体属性

概述

围绕主体的属性特征,每个主体 ID(OneID)绝对只有一行数据。

数据样例

OneID 字段

分区日期

属性字段 1

属性字段 2

属性字段 3

属性字段 4

...

10001

2022-01-01

mac

shanghai

运动

...

10002

2022-01-01

mobile

beijing

美术

...

10003

2022-01-01

mac

beijing

音乐

...

数据结构及字段要求

字段

字段类型

说明

OneID 字段

数值型(int/long/bigint)

  • 必填字段。
  • OneID 字段是全平台可识别的主体主键,比如是通过 IDM 转换获得的 OneID,又称基准 BaseID。
  • OneID 字段必须是数值型类型,且存储为数据集时必须是分片键(存储设置),用于快速查询。
  • OneID 字段必须是表的唯一键(存储设置),如存在重复数据,可前置做数据去重或设置唯一键的排序字段设定去重逻辑。

分区日期

日期型

  • 必填字段。
  • 系统自动生成或指定分区字段,无需手工配置。

属性字段

数值型/文本/时间/数组多值,不支持 map 类型

  • 选填字段。
  • 属性字段是围绕 OneID 的属性特征,如年龄/性别,用于直接生成用户的画像。
  • 属性字段支持数值/文本/时间/数组多值等,文本类型支持设置枚举字段,如城市编码配置城市名称。
  • 属性字段不支持 map 等特殊字段。

圈选组件使用逻辑

Image

说明

  1. OneID 一定是通过 IDMapping 转换算子生成。
  2. OneID 一定进行了数据去重或设置存储的唯一键,可采用去重算子处理。
  3. 必须是分区表,且最新分区存储全量数据,全量数据即每天将全部用户 OneID 同步到最新分区内。

3.2 行为事件

概述

围绕主体的行为日志,即谁(OneID)在什么时间(行为时间)做了什么事(行为事件)产生什么事件结果(属性),主体 ID 及行为事件及行为时间共同组成唯一键。

数据样例

OneID 字段

统计日期

默认采用分区日期

行为时间

行为事件

属性(数值类型-整数)

属性(数值类型-小数)

属性(文本类型)

10001

2023-9-7

1694075399

clickbutton

{"cost":200 ,
"click_cnt": 100}

{"balance": 100.11,
"mileage": 100.11}

{"buttonname": "测试",
"city": "上海"}

10001

2023-9-7

1694075392

pageview

{"cost":200 ,
"click_cnt": 100}

{"balance": 100.11,
"mileage": 100.11}

{"buttonname": "测试",
"city": "上海"}

10002

2023-9-7

1694075395

pageview

{"cost":200 ,
"click_cnt": 100}

{"balance": 100.11,
"mileage": 100.11}

{"buttonname": "测试",
"city": "上海"}

10003

2023-9-7

1694075397

pageview

{"cost":200 ,
"click_cnt": 100}

{"balance": 100.11,
"mileage": 100.11}

{"buttonname": "测试",
"city": "上海"}

数据结构及字段要求

字段

字段类型

说明

OneID 字段

数值型(int/bigint/long)

  • 必填字段。
  • OneID 允许存在重复数据。
  • OneID 字段必须是数值型类型,且存储为数据集时必须是分片键(存储设置),用于快速查询

统计日期

日期类型(date)

  • 必填字段。
  • 采用日期分区作为统计日期,其基本同行为时间保持一致,即按照数据产生时间增量存储。

行为时间

数值类型(int/bigint/long)

  • 必填字段。
  • 数值类型时间戳,以 11 位或 13 位时间戳。

行为事件

文本类型(string)

  • 必填字段。

属性(数值类型-整数)

Map 整数类型 Map(string,bigint)

  • 必填字段。
  • map 内的 key 是属性名称。
  • map 内的 value 是属性值。

如:{"cost":200 ,
"click_cnt": 100}
cost消耗金额 是属性名称,200 是属性值

属性(数值类型-小数)

Map 整数类型 Map(string,float)

  • 必填字段。
  • map 内的 key 是属性名称。
  • map 内的 value 是属性值。

属性(数值类型-文本)

Map 整数类型 Map(string,string)

  • 必填字段。
  • map 内的 key 是属性名称。
  • map 内的 value 是属性值。

圈选组件使用逻辑

Image

说明

  1. OneID 一定是通过 IDMapping 算子转换生成。
  2. 属性必须是Map结构,可通过可视化建模进行格式转换。
  3. 可以是分区表,但是必须是增量分区逻辑,即每天都是最新的行为事件。

3.3 业务明细

概述

围绕主体的业务事实数据,每个 ID 可能有多行数据,往往记录业务事实记录或统计数据,如消费金额汇总数据。

数据样例

OneID 字段

统计日期

默认采用分区日期

明细字段 1

累计消费金额

明细字段 2

消费城市

明细字段 3

消费类型

明细字段 4

10001

2022-01-01

100 元

shanghai

运动

...

10001

2022-01-02

200 元

hangzhou

音乐

...

10002

2022-01-02

300 元

beijing

美术

...

10003

2022-01-03

100 元

beijing

音乐

...

数据结构及字段要求

字段

字段类型

说明

OneID 字段

数值型(int/bigint/long)

  • 必填字段。
  • OneID 允许存在重复数据。
  • OneID 字段必须是数值型类型,且存储为数据集时必须是分片键(存储设置),用于快速查询。

统计日期

日期类型(date/datetime)

  • 必填字段。
  • 默认采用分区日期,且默认表为增量表,即每天(每个新分区)都是新增的数据;如业务数据是全量表,可通过可视化建模将全量表转化为增量表。
  • 日期必须具有增量业务含义,如创建时间/更新时间。

明细字段

数值型/文本/时间/数组多值,不支持 map 类型

  • 选填字段。
  • 明细字段是围绕 OneID 的明细业务事实数据,往往是统计类数据。

圈选组件使用逻辑

Image

说明

  1. OneID 一定是通过 IDMapping 算子转换生成。
  2. OneID 可以重复,即相同的 OneID 可以有多行数据。
  3. 必须是分区表,分区日期必须具有某种增量业务含义,每个最新分区为新增的业务事实数据,默认为增量表。

3.4 业务维度

概述:

维度数据模型的核心内容,围绕主体元数据内的某个维度对象展开的属性值的补充,其不绝对归属某个主体,可以关联多个主体的元数据构建关联查询逻辑,其数据结构类似于主体属性表。

数据样例

维度主键字段

分区日期

维度属性1

维度属性2

维度属性2

10001

2022-01-01

空调

上海

10002

2022-01-01

电视

便宜

上海

10003

2022-01-01

热水器

北京

10004

2022-01-01

自行车

便宜

北京

数据结构及字段要求

字段

字段类型

说明

维度主键字段

数值型/文本型。

  • 必填字段。
  • 维度主键字段必须唯一去重。

分区日期

日期型。

  • 必填字段。
  • 系统自动生成或指定分区字段,无需手工配置。

维度属性

数值型/文本/时间/数组多值,不支持 map 类型。

  • 选填字段。
  • 属性字段是围绕 维度主键 的属性特征,如年龄/性别,用于直接生成用户的画像。
  • 属性字段支持数值/文本/时间/数组多值等,文本类型支持设置枚举字段,如城市编码配置城市名称。
  • 属性字段不支持 map 等特殊字段。

圈选组件使用逻辑

Image

说明

  1. 维度主键无需经过IDMapping转换。
  2. 维度主键必须是保证去重唯一。
  3. 可以是分区表,但是必须是全量分区逻辑,即每天保存最新的全量数据。
  4. 产品联动Finder 元数据及Finder 业务对象表暂时不支持关联。

3.5 会话档案

概述:

会话档案是对会话记录的存档, 如企微对话、语音对话、和智能体对话,可用于会话分析、会话总结、话术推荐等场景。一般是增量分区表。

数据样例

会话id

主体OneID

时间分区

客户id

客户名称

客服id

客服名称

会话内容

会话开始时间

会话结束时间

会话持续时长

字符型属性

数值型属性

浮点型属性

10611228

1001

2025-01-01

1

周女士 15000000000

00301

保险顾问 - 小孙

2024-12-12 10:00:05_客户 (周女士 15000000000)_你好,咨询车险投保。 ;2024-12-12 10:00:20_客服 (保险顾问 - 小孙)_XX 保险官网,请问您的车型年份、车牌号? ;2024-12-12 10:01:05_客户 (周女士 15000000000)_2021 款 XX 轿车,车牌号京 A・12345。 ;2024-12-12 10:01:30_客服 (保险顾问 - 小孙)_查询基础报价,请稍候。 ;2024-12-12 10:03:15_客服 (保险顾问 - 小孙)_初步报价:交强险 950 元,车损险 1850 元,三者险 200 万保额 1200 元,合计 4000 元。 ;2024-12-12 10:04:00_客户 (周女士 15000000000)_三者险保额能否调整为 300 万? ;2024-12-12 10:04:25_客服 (保险顾问 - 小孙)_300 万保额费用增加 350 元,合计 4350 元,是否需要? ;2024-12-12 10:05:00_客户 (周女士 15000000000)_包含不计免赔险吗? ;2024-12-12 10:05:20_客服 (保险顾问 - 小孙)_车损险和三者险均默认包含不计免赔,无需额外付费。 ;2024-12-12 10:05:50_客户 (周女士 15000000000)_去年未出险,有优惠吗? ;2024-12-12 10:06:15_客服 (保险顾问 - 小孙)_连续 1 年未出险,商业险可享 8.5 折优惠,折后 4047.5 元。 ;2024-12-12 10:07:00_客户 (周女士 15000000000)_接受报价,如何投保? ;2024-12-12 10:07:25_客服 (保险顾问 - 小孙)_需提供行驶证照片、身份证正反面,通过官网链接上传,10 分钟内完成电子签约。 ;2024-12-12 10:08:00_客户 (周女士 15000000000)_保单何时生效? ;2024-12-12 10:08:15_客服 (保险顾问 - 小孙)_今日 15:00 前完成支付,保单次日零时生效,有效期 1 年。 ;2024-12-12 10:08:30_客户 (周女士 15000000000)_好的,现在上传资料。

2024-12-12 10:00:05

2024-12-12 10:08:30

505

{"key1":"字符1","key2":"字符2"}

{"key1":"1","key2":"2"}

{"key1":"2.1","key2":"2.2"}

10611229

1002

2025-01-01

2

董女士 18888888888

00302

保险顾问 - 小张

2025-02-03 11:20:00_客户 (董女士 18888888888)_您好呀!我得好好感谢你们公司,之前给我家两辆车买的保险,真的太贴心啦! ;2025-02-03 11:20:15_客服 (保险顾问 - 小张)_董女士,您太客气啦!能得到您的认可,我们特别高兴。方便和我讲讲具体是哪些方面让您满意吗? ;2025-02-03 11:21:00_客户 (董女士 18888888888)_当初买保险的时候,你帮我详细分析了不同险种组合,根据我家两辆车的使用情况,给我搭配了最划算又保障全的方案。这让我觉得你们特别专业、负责! ;2025-02-03 11:21:30_客服 (保险顾问 - 小张)_这是我们的本职工作呀,就是要根据每位客户的实际情况,提供最合适的保险计划。那在后续的使用过程中,还有其他让您满意的地方吗? ;2025-02-03 11:22:00_客户 (董女士 18888888888)_有啊!前阵子我老公那辆车出了点小剐蹭,他打电话咨询理赔。你们的客服特别耐心,一步一步教他怎么处理,还很快安排了定损员。定损员到现场后,态度也特别好,效率超高,没多久理赔款就到账了。我老公回来一直夸呢! ;2025-02-03 11:22:25_客服 (保险顾问 - 小张)_能让您和您家人都满意,就是我们最大的动力。我们一直都致力于为客户提供快速、贴心的理赔服务。 ;2025-02-03 11:23:00_客户 (董女士 18888888888)_而且啊,我平时有什么保险相关的小疑问,不管是打客服电话还是在微信上问,你们回复得都特别及时,解释得明明白白。感觉你们随时都在我身边,特别安心! ;2025-02-03 11:23:30_客服 (保险顾问 - 小张)_这都是我们应该做的,客户的疑问能及时得到解答,才能更放心地享受我们的保险服务。您的认可对我们来说就是最大的鼓励,我们会继续努力做到更好! ;2025-02-03 11:24:00_客户 (董女士 18888888888)_哈哈,你们已经做得超级好了!我身边朋友要是有保险需求,我肯定第一时间推荐你们,就冲你们这服务态度和专业水平,错不了! ;2025-02-03 11:24:30_客服 (保险顾问 - 小张)_太感谢您啦!我们会继续保持高标准服务,不辜负您和朋友们的信任。要是您或者您朋友以后还有其他问题,随时都可以联系我们。

2025-02-03 11:20:00

2025-02-03 11:24:30

270

10611230

1003

2025-01-01

3

林先生 13377777777

00303

保险顾问 - 小王

2024-12-25 13:00:00_客户 (林先生 13377777777)_你好,我想给我的房车投保,能咨询下相关情况吗? ;2024-12-25 13:00:15_客服 (保险顾问 - 小王)_您好,欢迎咨询。麻烦您告知一下房车的车型年份、车牌号以及行驶里程呢。 ;2024-12-25 13:01:00_客户 (林先生 13377777777)_2022 款 XX 房车,车牌号沪 B・5678X,行驶里程大概 3 万公里。 ;2024-12-25 13:01:30_客服 (保险顾问 - 小王)_好的,我这边查询基础报价,请您稍等。 ;2024-12-25 13:03:15_客服 (保险顾问 - 小王)_初步报价:交强险 1100 元,车损险 2500 元,第三者责任险 150 万保额 1000 元,车上人员责任险 5 座每座 5 万保额 500 元,合计 5100 元。 ;2024-12-25 13:04:00_客户 (林先生 13377777777)_第三者责任险保额能提高到 200 万吗?另外,房车的一些特殊装备比如太阳能板、户外家具这些能保吗? ;2024-12-25 13:04:25_客服 (保险顾问 - 小王)_200 万保额费用增加 200 元。对于房车的特殊装备,如果您在投保时额外勾选附加的装备险,是可以保障的,费用大概 800 元,这样总计就是 6100 元,您看需要吗? ;2024-12-25 13:05:00_客户 (林先生 13377777777)_这些保险包含不计免赔吗? ;2024-12-25 13:05:20_客服 (保险顾问 - 小王)_交强险不涉及不计免赔,车损险、第三者责任险和车上人员责任险默认都包含不计免赔,无需额外付费。但装备险的不计免赔需要额外加 80 元。 ;2024-12-25 13:05:50_客户 (林先生 13377777777)_我去年没出过险,有优惠吗? ;2024-12-25 13:06:15_客服 (保险顾问 - 小王)_连续 1 年未出险,商业险部分可以享受 9 折优惠,折后 5562 元(包含装备险不计免赔)。 ;2024-12-25 13:07:00_客户 (林先生 13377777777)_接受报价,请问怎么投保呢? ;2024-12-25 13:07:25_客服 (保险顾问 - 小王)_您需要提供行驶证照片、身份证正反面照片,通过我们的保险官网链接上传,15 分钟内完成电子签约。签约成功后就可以进行支付了。 ;2024-12-25 13:08:00_客户 (林先生 13377777777)_保单什么时候生效呢? ;2024-12-25 13:08:15_客服 (保险顾问 - 小王)_如果您在今日 17:00 前完成支付,保单次日零时生效,有效期 1 年。 ;2024-12-25 13:08:30_客户 (林先生 13377777777)_好的,我现在就去准备资料上传。

2024-12-25 13:00:00

2024-12-25 13:08:30

510

10611231

1001

2025-01-02

1

周女士 15000000000

00301

保险顾问 - 小孙

2024-12-30 10:30:00_客户 (周女士 15000000000)_你好,我想咨询下摩托车的保险投保事宜。 ;2024-12-30 10:30:15_客服 (保险顾问 - 小孙)_您好呀,欢迎咨询。麻烦您说一下摩托车的车型年份、车牌号呢。 ;2024-12-30 10:31:00_客户 (周女士 15000000000)_2023 款 XX 牌摩托车,车牌号粤 A・M1234。 ;2024-12-30 10:31:30_客服 (保险顾问 - 小孙)_好嘞,我这就查询基础报价,请您稍等片刻。 ;2024-12-30 10:33:15_客服 (保险顾问 - 小孙)_初步报价:交强险 360 元,车损险 800 元,第三者责任险 50 万保额 400 元,合计 1560 元。 ;2024-12-30 10:34:00_客户 (周女士 15000000000)_这个第三者责任险保额有点低,能调到 100 万吗? ;2024-12-30 10:34:25_客服 (保险顾问 - 小孙)_100 万保额的话费用会增加 300 元,这样合计就是 1860 元,您看是否需要调整呢? ;2024-12-30 10:35:00_客户 (周女士 15000000000)_这些保险里包含盗抢险吗?我这摩托车挺贵的,担心被盗。 ;2024-12-30 10:35:20_客服 (保险顾问 - 小孙)_目前的报价里不包含盗抢险哦。如果您想加购盗抢险,费用是 200 元,总计就是 2060 元。 ;2024-12-30 10:35:50_客户 (周女士 15000000000)_包含不计免赔险吗? ;2024-12-30 10:36:15_客服 (保险顾问 - 小孙)_交强险没有不计免赔,车损险和第三者责任险默认是包含不计免赔的,无需额外付费。盗抢险的不计免赔需要额外支付 20 元。 ;2024-12-30 10:36:50_客户 (周女士 15000000000)_我去年摩托车保险没出过险,有优惠不? ;2024-12-30 10:37:15_客服 (保险顾问 - 小孙)_连续 1 年未出险的话,商业险部分可以享受 8.8 折优惠,折后 1860.8 元(包含盗抢险不计免赔)。 ;2024-12-30 10:38:00_客户 (周女士 15000000000)_行,接受报价,那咋投保呀? ;2024-12-30 10:38:25_客服 (保险顾问 - 小孙)_您得提供行驶证照片、身份证正反面照片,通过我们官网的指定链接上传,然后在 20 分钟内完成电子签约。 ;2024-12-30 10:39:00_客户 (周女士 15000000000)_保单啥时候生效呀? ;2024-12-30 10:39:15_客服 (保险顾问 - 小孙)_要是您在今日 16:00 前完成支付,保单次日零时就生效,有效期 1 年。 ;2024-12-30 10:39:30_客户 (周女士 15000000000)_好嘞,我现在就去准备资料上传。

2024-12-30 10:30:00

2024-12-30 10:39:30

570

10611232

1002

2025-01-02

2

董女士 18888888888

00302

保险顾问 - 小张

2024-11-05 09:15:08_客户 (董女士 18888888888)_下午 2 点汽车保养有空位吗? ;2024-11-05 09:15:25_客服 (保险顾问 - 小张)_XX 汽车 4S 店海淀店,请问您的车型和行驶里程? ;2024-11-05 09:16:10_客户 (董女士 18888888888)_2022 款 XX 型,里程 3.2 万公里,做基础保养。 ;2024-11-05 09:16:40_客服 (保险顾问 - 小张)_查询 14:00 时段保养工位情况。 ;2024-11-05 09:18:22_客服 (保险顾问 - 小张)_下午 2 点标准保养工位已满,14:30 有快速保养通道空位,是否接受? ;2024-11-05 09:19:05_客户 (董女士 18888888888)_快速保养和标准保养有什么区别? ;2024-11-05 09:19:40_客服 (保险顾问 - 小张)_快速通道耗时约 45 分钟,含机油更换和基础检查;标准保养需 1.5 小时,增加全车安全检测。 ;2024-11-05 09:20:20_客户 (董女士 18888888888)_选快速保养,需要提前准备什么? ;2024-11-05 09:20:50_客服 (保险顾问 - 小张)_需携带行驶证和保养手册,车牌号 123-ABC 已记录,到店后直接至 3 号接待台。 ;2024-11-05 09:21:30_客户 (董女士 18888888888)_保养费用大概多少? ;2024-11-05 09:22:00_客服 (保险顾问 - 小张)_快速保养套餐原价 580 元,本周优惠价 498 元,包含工时费。 ;2024-11-05 09:22:25_客户 (董女士 18888888888)_确认预约快速保养。 ;2024-11-05 09:22:55_客服 (保险顾问 - 小张)_已预约 11 月 5 日 14:30 海淀店快速保养,预计 15:15 完成,如需延迟请提前 1 小时通知。 ;2024-11-05 09:23:10_客户 (董女士 18888888888)_好的,知道了。 ;2024-11-05 09:23:30_客服 (保险顾问 - 小张)_预约信息已发送至您手机,含工位号和服务顾问联系方式。

2024-11-05 09:15:08

2024-11-05 09:23:30

502

数据结构及字段要求

字段

字段说明

字段类型

说明

会话id

会话唯一标识字段,如果原会话有一段对话的唯一标识便采用原id;若没有,是经过数据处理聚合的新id

string

  • 必填字段
  • 表的唯一键,会话id不可重复。

主体OneID

目标主体的OneID字段

int

  • 必填字段
  • OneID 字段是全平台可识别的主体主键,比如是通过 IDM 转换获得的 OneID,又称基准 BaseID
  • OneID 字段必须是数值型类型,且存储为数据集时必须是分片键(存储设置),用于快速查询

客户id

用于保存客户原始id字段

string

  • 必填字段
  • 若语音对话、智能体对话等无客户原始id,可随机生成一个,如均默认“xxxxxxxx”

客户名称

用于保存客户名称的字段

string

  • 必填字段
  • 若语音对话、智能体对话等无客户原始id,可随机生成一个,如均默认“xxxxxxxx”

客服id

用于保存客服原始id的字段

string

  • 必填字段
  • 若语音对话、智能体对话等无客户原始id,可随机生成一个,如均默认“xxxxxxxx”

客服名称

用于保存客服name的字段

string

  • 必填字段
  • 若语音对话、智能体对话等无客户原始id,可随机生成一个,如均默认“xxxxxxxx”

会话内容

用于保存一段完整的对话内容的字段

string

  • 必填字段
  • 基于可视化加工后的一段有序的业务对话

会话开始时间

用于保存一段对话的第一条消息发送时间的字段

datetime

  • 必填字段

会话结束时间

用于保存一段对话的最后一条消息发送时间的字段

datetime

  • 必填字段

会话持续时长

用于保存这段会话持续时长的字段

int

  • 必填字段
  • 单位是秒

时间分区

数据的时间分区字段

date

  • 必填字段
  • 可视化建模生成的P_date字段

字符型属性

用于保存string类型的属性字段

map<string,string>

  • 非必填字段
  • 若有额外的字符型字段需要展示或应用,可冗余在这里。

数值型属性

用于保存int类型的属性字段

map<string,int>

  • 非必填字段
  • 若有额外的数值型字段需要展示或应用,可冗余在这里。

浮点型属性

用于保存float类型的属性字段

map<string,float>

  • 非必填字段
  • 若有额外的浮点型字段需要展示或应用,可冗余在这里。

圈选组件使用逻辑

会话档案目前只能在「会话洞察」模块使用,暂不支持标签和分群的圈选组件使用。

备注说明

说明

为了在「会话洞察-会话明细-会话详情」模块,能够结构化地展示对话内容,如下图。需将会话档案中的“会话内容”字段按照一定格式要求处理:
消息的标准格式:

  1. text_yyyy-MM-dd HH:mm:ss_角色(名称)_消息内容\n;
  • 含义:文本类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
  • 需注意:消息内容后需跟固定的特殊字符“\n;”
  1. image_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
  • 含义:图片类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
  • 需注意:消息内容后需跟固定的特殊字符“\n;”
  1. audio_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
  • 含义:视频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
  • 需注意:消息内容后需跟固定的特殊字符“\n;”
  1. video_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
  • 含义:音频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
  • 需注意:消息内容后需跟固定的特殊字符“\n;”
  1. file_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;
  • 含义:文件类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
  • 需注意:消息内容后需跟固定的特殊字符“\n;”

会话档案暂时只支持文本类型消息,其他模态正在迭代中。

结构化展示对话内容:
Image
Image

4. 操作说明

4.1 查看数据档案列表

展示已创建的数据档案的信息,包括数据档案名称、类型、创建人、数据更新频率、数据最新更新时间;用户通过左上角可以选择关联主体,或搜索数据档案名称,快速找到对应数据档案。

  • 档案类型:包含主体属性、行为事件、业务明细、业务维度,和会话档案,且支持快捷筛选;
  • 更新频率:包含实时、离线两种更新频率,且支持快捷筛选;
  • 最新更新时间:记录该数据源最新的更新时间,且支持按照升序/降序排列;
    Image

4.2 新建数据档案

  1. 点击 新建数据档案
    Image

  2. 选择 数据档案 类型,包括主体属性、行为事件、业务明细、业务维度、会话档案五种类型。
    Image

    字段

    说明

    主体属性

    主体属性每天获取数据集最新分区的数据,需要保证最新【数据集分区】包含全部主体的属性特征。

    业务明细

    用户使用业务明细时,首先会选择最近N天的数据,此时最近N天是通过【数据集分区】=最近N天进行过滤,因此需要保证数据集分区按照某种业务日期进行定义,如订单创建时间。

    业务维度

    业务维度每天获取数据集最新分区的数据,需要保证最新【数据集分区】包含全部业务维度的属性特征。

    会话档案

    会话档案每天获取数据集最新分区的数据,需要保证最新【数据集分区】包含全部会话的属性特征。

4.2.1 新建主体属性数据档案

点击「新建数据档案」,选择「主体属性」并点击,在编排页完成相关配置。系统将根据所选数据集,自动关联生命周期、更新频率及OneID主键字段,不支持手动更改。
Image

参数

说明

数据集

  • 默认支持ClickHouse/ByteHouse存储的数据集
  • 允许例行定时更新/实时更新的数据集
  • 支持与Hive数据集绑定,后续可在创建导入标签时使用(注意:此功能默认关闭,如需启用,请在部署时告知并开启对应功能开关)

数据档案名称

不超过100字,允许中英文、数字、下划线。

数据档案描述

支持填写对该数据档案的补充描述,方便业务理解。

关联主体

选择需要关联的主体即可。

档案更新类型

分区全量更新。

注册档案信息位置

勾选需要注册的数据集字段(默认会勾选OneID字段及分区字段),支持修改字段展示名,及增加档案字段描述。

4.2.2 新建行为事件数据档案

点击「新建数据档案」,选择「行为事件」并点击,在编排页完成相关配置。系统将根据所选数据集,自动关联生命周期、更新频率及OneID主键字段,不支持手动更改。
Image

参数

说明

数据集

  • 默认支持ClickHouse/ByteHouse存储的数据集
  • 允许例行定时更新/实时更新的数据集

数据档案名称

不超过100字,允许中英文、数字、下划线。

数据档案描述

支持填写对该数据档案的补充描述,方便业务理解。

关联主体

选择需要关联的主体即可。

档案更新类型

分区增量更新。

行为事件配置

依次配置行为时间、行为事件、行为属性字段。

行为时间字段

Event_time,通常用13位时间戳,限制字段类型为int/long等数值类型。

行为事件字段

Event_type,存储事件名称的字段,如「page_view」「Clickbutton」,限制字段类型为string字符串类型。

行为属性字段

Event_params,通常以json的方式存储点击事件的内容,如「Clickbutton」涉及的页面信息/按钮/设备等,限制字段类型为Map类型,可包含Map{String,String}Map{String,Float}/Map{String,Int32}/Map(String, Array(String))/Map(String, Datetime)类型。

4.2.3 新建业务明细数据档案

点击「新建数据档案」,选择「业务明细」并点击,在编排页完成相关配置。系统将根据所选数据集,自动关联生命周期、更新频率及OneID主键字段,不支持手动更改。
Image

参数

说明

数据集

  • 默认支持ClickHouse/ByteHouse存储的数据集
  • 允许例行定时更新/实时更新的数据集

数据档案名称

不超过100字,允许中英文、数字、下划线。

数据档案描述

支持填写对该数据档案的补充描述,方便业务理解。

关联主体

选择需要关联的主体即可。

档案更新类型

支持下拉选择分区增量更新、分区全量更新。

*升级后,存量客户的主体属性数据档案默认为全量更新,行为&明细数据档案默认为增量更新。

注册档案信息位置

勾选需要注册的数据集字段(默认会勾选OneID字段及分区字段),支持修改字段展示名,及增加档案字段描述。

  1. 主体属性数据档案、业务明细数据档案的属性字段,支持属性分类

  2. 业务明细数据档案支持配置「关联ID」。
    Image

    1. 功能用途:在业务明细档案对相应字段关联ID后,在新建用户分群时,可以在基于OnelD过滤后,支持基于关联ID再次筛选,改善以往圈出base_id下多个手机号/会员号的情况,通过过滤可精确圈选出所需的手机号/会员。
    2. 应用场景-和分群创建联动:
      CDP中分群的圈选常规情况下都用OneID字段进行查询,但业务场景可能存在一个OndID(如1001)对应了2个会员ID(A和B),一个是会员ID(A)的属性是白金会员、一个会员ID(B)的属性是黄金会员,想圈出“最近3个月到访过门店且是白金会员”的用户进行营销。
      若按照常规圈选,按照“最近3个月到访过门店且是白金会员”这个条件会基于OnelD查询(即会把1001这个用户查出来),再将OneID转化成会员ID(同时查出了A和B),那这时不符合只想营销白金会员的想法。
      故通过子ID在原来的基础上,再加一个基于子ID(如上文中的会员ID)的过滤条件,即“会员=白金”将会员A过滤出来,只对会员A进行营销。
      Image
    3. 操作方式
      数据档案-业务明细档案-给数据集字段「membershipID」其「关联Id」设置为OneID的子ID(mem2)-保存该数据档案。
      用户分群-新建用户分群-设定圈选条件为(会员等级=白金)-ID类型选择「mem2」-添加条件(上一步保存的数据档案-白金-最近3月)

4.2.4 新建业务维度数据档案

点击「新建数据档案」,选择「业务明细」并点击,在编排页完成相关配置。系统将根据所选数据集,自动关联生命周期、更新频率及OneID主键字段,不支持手动更改。
Image

参数

说明

数据集

  • 只允许ClickHouse/ByteHouse存储的数据集。
  • 只允许例行定时更新/实时更新的数据集。
  • 仅业务明细&行为事件支持实时数据集,主体属性不支持实时数据集。

数据档案名称

不超过100字,允许中英文、数字、下划线。

数据档案描述

支持填写对该数据档案的补充描述,方便业务理解。

关联主体

选择需要关联的主体即可。

档案更新类型

支持下拉选择分区增量更新、分区全量更新。

  • 分区增量更新:每天分区存储增量数据。若需查询最近7天某个业务含义日期(如订单创建时间是分区日期)的数据,需要跨分区查询。
  • 分群全量更新:每天分区存储全量数据。若需查询最近7天某个业务含义日期(如订单创建时间)的数据,查询最新分区即可。

*升级后,存量客户的主体属性数据档案默认为全量更新,行为&明细数据档案默认为增量更新。

注册档案信息位置

勾选需要注册的数据集字段(默认会勾选维度主键及分区字段),支持修改字段展示名,及增加档案字段描述。

4.2.5 新建会话档案数据档案

  1. 点击「新建数据档案」,选择「会话档案」并点击,支持创建多个,在编排页完成相关配置。系统将根据所选数据集,自动关联生命周期、更新频率、OneID主键字段及会话档案ID字段,不支持手动更改。
    Image

    参数

    说明

    数据集

    下拉选择可用的数据集注册成为VeCDP可被查询使用的数据档案。
    1.只能选择VeCDP应用与数据档案类型匹配的数据集,即ClickHouse/ByteHouse。
    2.只允许例行定时更新/实时更新的数据集。
    3.为了查询加速,注册不同类型数据档案时可能会存在部分数据集不可用,需要做ETL处理。

    数据档案名称

    不超过100字,允许中英文、数字、下划线。

    数据档案描述

    支持填写对该数据档案的补充描述,方便业务理解。

    关联主体

    选择需要关联的主体即可。

    会话数据来源

    下拉进行选择,可选择企业会话-单聊、智能体、语音会话。

    档案更新类型

    支持分区增量更新。

    注册档案信息位置

    勾选需要注册的数据集字段(默认会勾选维度主键及分区字段),支持修改字段展示名,及增加档案字段描述。

    主体OneID

    目标主体的OneID字段。

    客户ID

    用于保存客户ID段。

    客户名称

    用于保存客户名称的字段。

    客服ID

    用于保存客服ID字段。

    客服名称

    用于保存客服name的字段。

    会话内容

    用于保存一段完整的对话内容的字段。

    会话开始时间

    用于保存一段对话的第一条消息发送时间的字段。

    会话结束时间

    用于保存一段对话的最后一条消息发送时间的字段。

    会话持续时长

    用于保存这段会话持续时长的字段。

    时间分区

    字段类型为date。

    字符型属性

    用于保存string类型的属性字段。

    数值型属性

    用于保存int类型的属性字段。

    浮点型属性

    用于保存float类型的属性字段。

4.3 管理数据档案

  1. 支持编辑数据档案,点击 编辑 即可。
    Image
  2. 支持删除数据档案,删除时,系统会显示下游依赖的标签等信息,请谨慎删除。用户若想编辑或删除该数据档案,点击 删除 即可。
    Image