You need to enable JavaScript to run this app.
导航
会话档案
最近更新时间:2025.07.11 15:00:25首次发布时间:2025.07.11 15:00:25
复制全文
我的收藏
有用
有用
无用
无用

概述

会话档案是客户数据平台(VeCDP)中用于管理和分析历史会话数据的模块,可以存档会话记录,如企微对话、语音对话,可用于会话分析、会话总结、话术推荐等场景,支持在「会话洞察」模块中进行明细查询和分析。

注意与前提
  1. 会话档案目前能应用的场景只适用于会话洞察模块,不能应用于 VeCDP 标签生产、分群生产、群体画像洞察等组件。
  2. 会话洞察属于Data Agent功能模块,需要单独购买。

操作步骤

Step1:系统登录

  1. 使用账号密码登录客户数据平台后,点击导航栏「数据管理」,下拉选择「数据档案管理」。
    Image

Step2:会话数据接入与管理

  • 数据类型:历史离线会话,目前不支持实时进线数据。
  • 数据来源:企微、外呼、导购机器人等。

企微:

  1. 若企微会话存档数据已完成接入,则直接从数据库表读取即可,需至少保留2个字段,id列和内容列,如下所示。

  2. 若企微会话数据未同步,则可以从数据源进行接入,如下所示。

    1. 点击「数据管理」,下拉选择「数据连接」,进入页面。
      Image

    2. 选择左侧「新建数据连接」,在类别里选择「微信生态」,点击「企业微信」。
      Image

    3. 填写公钥,点击授权。

其他数据类型

外呼数据、导购机器人数据等数据若存储于Hive表等系统,需根据数据实际存储位置配置连接。

Step3:新建会话档案

数据档案

  1. 点击「数据管理」,下拉选择「数据档案管理」,点击「会话档案」。
    Image
    Image

  2. 点击「新建数据档案」,选择「会话档案」并点击,支持创建多个,在编排页完成相关配置。
    Image

    相关字段

    字段说明

    会话档案

    会话档案每天获取数据集最新分区的数据,请保证最新「数据集分区」包含全部会话档案的属性特征。

    数据集

    下拉选择可用的数据集注册成为VeCDP可被查询使用的数据档案。
    1.只能选择VeCDP应用与数据档案类型匹配的数据集。
    2.只允许例行定时更新/实时更新的数据集。
    3.为了查询加速,注册不同类型数据档案时可能会存在部分数据集不可用,需要做ETL处理。

    数据档案名称

    自定义,不超过100字,允许中英文、数字、下划线。

    数据档案描述

    自定义。

    关联主体

    选择数据档案挂在哪个主体下。

    会话数据来源

    下拉进行选择,可选择企业会话-单聊、智能体、语音会话。

    分区增量更新

    每天分区存储增量数据。若需查询最近7天某个业务含义日期(如订单创建时间是分区日期)的数据,需要跨分区查询。

    会话ID

    会话唯一标识字段,如果原会话有一段对话的唯一标识便采用原ID若没有,是经过数据处理聚合的新ID。

    会话类型

    会话类型:如企微会话-单聊、语音外呼-A渠道等,采用系统定义的枚举值,字段类型为string。

    主体OneID

    目标主体的OneID字段。

    客户ID

    用于保存客户ID段。

    客户名称

    用于保存客户名称的字段。

    客服ID

    用于保存客服ID字段。

    客服名称

    用于保存客服name的字段。

    会话内容

    用于保存一段完整的对话内容的字段。

    会话开始时间

    用于保存一段对话的第一条消息发送时间的字段。

    会话结束时间

    用于保存一段对话的最后一条消息发送时间的字段。

    会话持续时长

    用于保存这段会话持续时长的字段。

    时间分区

    字段类型为date。

    字符型属性

    用于保存string类型的属性字段。

    数值型属性

    用于保存int类型的属性字段。

    浮点型属性

    用于保存float类型的属性字段。

  3. 会话档案页面,可对各个会话档案进行「编辑」和「删除」。
    Image

可视化建模

需通过「可视化建模」模块,将会话数据中的一条条message加工成一个标准的会话session(即一段对话)。
Image

  1. 点击「数据管理」,选择「可视化建模」,左侧列表选择「任务列表」,点击「新建」。
    Image

  2. 点击「➕」,添加需要连接的数据。其余流程也可参考下图内红标部分。
    Image

  3. 「添加数据连接」时,用户可以选择「已有数据连接」的内容,也可自行「新建数据连接」。
    Image

  4. 选择其中一个数据连接,并将其从左侧列表里拉入右侧面板。(示例:选择「会话档案」,将其拉入右侧。)
    Image
    Image

  5. 点击右侧小加号,「输出」到「输出数据集」,并在CDP应用中下拉选择「数据档案-会话档案」,再进行相应配置。
    Image
    Image

    相应参数

    参数说明

    名称及描述

    自定义。

    VeCDP应用

    注:由于VeCDP下游部分应用存在特殊查询逻辑,请根据需要选择合适的应用场景。
    数据档案-会话档案:用于注册会话档案,该类数据集需必填会话ID字段,一般是增量分区表。

    基准ID字段

    仅支持int/short/long类型字段。

    会话ID

    会话原始ID,用于标识会话,支持选择int、string类型的字段。

    类型

    仅支持ClickHouse。

    数据生命周期

    作用:
    抽取至系统存储中数据的有效保留天数,非分区表根据数据更新时间保留数据,日期分区则根据分区日期保留数据,生命周期外的数据每天0点会自动清除。默认设定为7天。

    分区

    一级分区必须为date类型,若无合适字段,可以选择“系统默认分区”(对天、周、 月级别例行同步任务的取值为任务例行执行的前一天,对小时、分钟级别例行同步任务取值为任务例行执行当天, 对手动运行的任务的取值为运行时选择的业务时间),二级分区可选小时或其他取值可枚举的字段作为分区(必须在高级设置打开动态分区)。

    排序键

    将最常用作过滤条件的字段设置为排序键,可以使查询会更快。
    可以设置多个字段为排序键,第1个字段作用最大,其余依次递减,建议不超过3个。
    不能使用分区字段作为排序键。

    分片字段

    用于确保数据均分分布在各个存储节点上。若每天数据量不超过2000w行,请保留系统默认设置。
    只能设置一个字段为分片字段,可以选择最常用作维度的字段(该字段枚举值超过100个才需要设置),或者最常用作去重计数指标的字段(该字段枚举值超过1w个才需要设置,如user_id、device_id、item_id等)。

    抽样字段

    在可视化查询模块中可按此字段抽样进行查询,只支持int,float,string类型的字段。

    唯一键去重

    唯一键去重指在数据处理过程中,依据某个或某些被定义为唯一键的字段,去除重复的数据记录。系统默认为否。

    注意

    为了在「会话洞察-会话明细-会话详情」模块,能够结构化地展示对话内容,如下图。需将会话档案中的“会话内容”字段按照一定格式要求处理:

    • 标准格式的展示效果

    Image
    Image

    • 消息的标准格式

    text_yyyy-MM-dd HH:mm:ss_角色(名称)_消息内容\n;

    含义:文本类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
    需注意:消息内容后需跟固定的特殊字符“\n;”

    image_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;

    含义:图片类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
    需注意:消息内容后需跟固定的特殊字符“\n;”

    audio_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;

    含义:视频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
    需注意:消息内容后需跟固定的特殊字符“\n;”

    video_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;

    含义:音频类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
    需注意:消息内容后需跟固定的特殊字符“\n;”

    file_yyyy-MM-dd HH:mm:ss_角色(名称)_文件地址\n;

    含义:文件类型消息_消息发送时间_客户或客户(客户名称或客服名称)_消息内容\n;
    需注意:消息内容后需跟固定的特殊字符“\n;”

    • 举例:

    2024-10-20 14:30:05_客户 (李先生 189xxxxxxxxx)_下午 5 点健身私教课有空位吗? ;2024-10-20 14:30:20_客服 (运动顾问 - 张)_XX 健身中心浦东店,需咨询哪个课程类型? ;2024-10-20 14:31:08_客户 (李先生 189xxxxxxxxx)_增肌塑形套餐,1 对 1 指导。 ;2024-10-20 14:31:35_客服 (运动顾问 - 张)_查询 17:00 时段预约情况。 ;2024-10-20 14:33:12_客服 (运动顾问 - 张)_下午 5 点私教已预约满,傍晚 6 点有教练 A 空档,是否调整? ;2024-10-20 14:34:01_客户 (李先生189xxxxxxxxx)_6 点可接受,教练 A 的资质如何? ;2024-10-20 14:34:45_客服 (运动顾问 - 张)_教练 A 有 5 年从业经验,擅长力量训练,需查看详细资料吗? ;2024-10-20 14:35:10_客户 (李先生 189xxxxxxxxx)_不需要,直接预约。 ;2024-10-20 14:35:38_客服 (运动顾问 - 张)_预约 10 月 20 日 18:00 浦东店私教 A,手机号 189xxxxxxxxx,需提前 15 分钟到店签到。 ;2024-10-20 14:36:05_客户 (李先生 189xxxxxxxxx)_课程包含体测吗? ;2024-10-20 14:36:30_客服 (运动顾问 - 张)_首节课程含免费体测,后续每次课结束提供数据记录。 ;2024-10-20 14:36:50_客户 (李先生 189xxxxxxxxx)_确认预约。 ;2024-10-20 14:37:15_客服 (运动顾问 - 张)_已发送确认短信,含场馆地址和教练联系方式,变动需提前 4 小时取消。 ;2024-10-20 14:37:30_客户 (李先生 189xxxxxxxxx)_信息确认。 ;2024-10-20 14:37:45_客服 (运动顾问 - 张)_预约已存档,如需调整可随时联系。

    • 备注:本期会话洞察模块仅支持文本类消息,不支持其他类型解析和读取。

Step4:会话档案应用

会话档案目前能应用的场景只适用于会话洞察模块,不能应用于 VeCDP 标签生产、分群生产、群体画像洞察等组件。详情可参考:使用实践:会话分析场景

权限管理

概述

平台各功能模块涉及多项权限,如账号、用户、标签等权限。在本模块中用户可以集中管理各项权限与授权,更安全合规的使用企业数据。

管理者角色类型

目前具有三个管理角色,分别为集团管理员>项目管理员>资源管理者

职位描述

权限范围

集团管理员

单集团管理员为Admin账号(不支持灵活配置),具有集团最高权限,可管理、编辑、查看集团下所有项目的功能、资源、数据行权限。

Id-mapping 配置为集团管理员专享,仅集团管理员可对该项进行配置。集团管理员可配置项目管理员和资源管理者。

项目管理员

具有项目最高权限,可管理、编辑、查看对应项目的功能、资源、数据行权限。项目管理员可以灵活设置。

项目管理员可在其拥有的项目权限范围内进行权限配置。

资源管理者

资源管理者,在各个业务模块( 标签模块、分群模块),为其他用户授予资源权限,资源管理者可以灵活设置。

可在其拥有的资源权限范围内进行资源权限配置。

授权对象

有4种授权对象,包含用户、角色、用户组、部门,其概念和关系如下:

概念

释义

用户

用户是单个独立账号对应的主体,用户可以属于角色、用户组、部门。

角色

角色是一批用户的集合,是集团粒度的(某角色创建后,会在同一个集团下的不同项目均展示,且用户一致)。

用户组

用户组也是一批用户的集合,是项目粒度的(同一个集团下的各个项目,可以拥有不同的用户组)。

部门

部门是组织架构,具有层级关系,也是用户的集合,是平台粒度的(全平台只能拥有一套部门,不同集团的部门一样)。

授权内容

有4种授权内容,包含项目、功能(模块)、资源、数据行权限。

概念

释义

项目

指的是项目空间,包含该项目下的所有授权内容,如功能、资源、数据行权限。

功能(模块)

页面菜单和按钮权限,如数据管理模块、标签模块的查看、编辑、管理权限。

资源

资源是系统生产的资产,如数据集、数据档案、标签、分群等,资源有查看、编辑、管理权限。

数据规则

是资源下某一行的权限,如售卖渠道标签,有些用户只能查看“渠道=抖音”的标签、有些用户只能查看“渠道=京东、天猫”的标签。

授权规则

  • 授权机制: 基于管理员授权机制,不支持权限申请,集团管理员、项目管理员可以给普通用户授予权限。
  • 授权模型: 授权逻辑基于“ABAC+RBAC”模型,非常灵活,对用户、用户组、角色、部门均可以授予项目、功能、资源、数据行权限。
  • 权限继承:
    • 用户会继承用户组、角色、部门的项目、功能、资源、数据行权限。

举例:用户A有资源1的权限,A用户属于角色F,角色F有资源2的权限,那用户A也会同时有资源2的权限。

  • 项目、功能、资源权限,根据授权类型来判断取交集还是并集。如果是“授权”逻辑,最终取并集;如果是“禁用”逻辑,最终取“交集”。

举例:
项目、功能、标签等资源走的是授权逻辑,当用户A同时属于角色F(有资源2的权限)、角色H(有资源3的权限),那用户A会有资源2+资源3的权限;
指标资源、主体资源走的是禁用逻辑,当用户A被禁用了资源1、且被禁用了资源2,则这2个的资源权限都没有。

  • 数据行权限取交集。

举例:
数据行权限规则1(只能访问“渠道=抖音”的数据)与数据行权限规则2(只能访问“性别=男”的数据)的授权用户中均有用户A,用户A可访问数据为“渠道=抖音”且“性别=男”的数据,缩小了数据范围。

配置流程

管理员账号登录

私有化环境为独立部署,即基于控制台(以下简称Portal底座)开发,因此集团管理员需要对用户进行权限配置时,需要通过控制台账号来登录,登录一个Portal账号可以对该账号下所有已购买的火山数据产品进行操作。

配置步骤

点击 项目中心-权限 ,进入该模块。
Image
同时,在单个功能模块中也可以通过点击右边**...** 选择授权给, 即可选择授权对象,将所选资源授权给用户。
Image

功能介绍

权限管理分为两部分:

模块

功能介绍

操作文档

Part 1

火山引擎-访问控制

用于创建项目、用户账号、角色等。
可直接关联并使用创建后的用户、角色。

访问控制文档

Part 2

项目中心

用于管理用户、用户组,授权各类权限等。

按用户管理
按内容管理

名词解释

名词

解释说明

项目

是使用产品的一个独立“空间”,项目之间除共享服务器硬件资源外其余资源均独立隔离,如用户权限、数据资源在项目A与项目B都不同。

项目中心-用户

产品的使用者,需要在火山引擎访问控制中创建,具备项目、账号、邮箱、电话等信息。

项目中心-用户组

用户组是指具备特殊业务含义的一组用户,只属于某个项目,且不能跨项目使用。需要在项目中心授权管理中独立创建。

模块

产品的功能模块,对应各自的菜单。支持在项目中心进行模块使用权限授权。

资源

用户在该产品生产的资源,如标签、数据集、人群包、洞察报告、可视化建模任务。支持在项目中心进行资源权限授权(用户分群及用户洞察的授权在详情页操作)。

数据

特指产品中的标签、数据集等,可通过规则限制用户可使用的ID资产范围;也可管控数据应用场景,用户可用的表、列字段。

推荐配置流程

步骤

说明

配置入口

配置操作

确定管理员

根据集团与项目的划分逻辑,确定集团与项目管理员,集团管理员默认有该集团下全部项目的权限,项目管理员需要项目创建者手动授予”项目管理权限点”。

单集团的集团管理员为admin,不支持设置其他人,多集团的管理员可灵活设置多个人。

集团管理员设置:
Image
项目管理员设置:
Image

集团管理员配置入口:
Image
项目管理员配置入口
Image

完成配置之前,需要先在火山引擎控制台创建项目、角色账号和角色等。操作文档参考:身份配置

确定授权对象

不建议为单个用户一个个授权,效率低,且后续维护成本高,建议:

  1. 如果权限体系要对接组织架构,那建议将组织架构作为主授权对象,辅以用户组可以做一些灵活变更。
  2. 如果权限体系不对接组织架构,建议用“角色”或“用户组”作为主授权对象。
  • 什么时候用“角色”

角色是集团粒度的,跨项目。创建一个角色后,会在该集团下的各个项目中可见,各个项目无需重复创建。如果各个项目的角色一致,都存在数据开发、运营人员、营销人员等角色,便适合用“角色”概念。

  • 什么时候用“用户组”

用户组是项目粒度的,创建的一个用户组只在该项目可用。如果只需要在项目粒度使用,比如某项目数据开发A组、运营B组等,便适合用“用户组”概念。

Image

完成授权之前,需要先添加用户后方可按角色或角色组进行授权,用户添加可参考文档:添加用户

授予功能模块权限

为部门/角色/用户组批量授予功能权限。

按用户管理:
Image
Image
按内容管理:

按用户管理参考文档:按用户管理
按内容管理:
按内容管理

授予资源权限

为部门/角色/用户组批量授予可视化建模任务、数据集、标签、分群等批量授予资源权限。资源支持全局授权,可将全部标签、分群、洞察报告的查看、编辑、管理权限授予对应对象。

按用户管理:
Image
按内容管理:
Image

参考文档: 全局资源授权。
按用户管理:
按用户管理
按内容管理:按内容管理

授予数据规则权限

目前只支持“标签”进行行权限控制,比如A用户在此平台只能查看“来源渠道=微信“的用户,B用户在此平台只能查看“来源渠道=抖音”的用户。
举例:银行建设了客户标签体系,可查看各个客户的标签及标签值。但存在银行每个客户经理管理的客户不一样,每个客户经理只能查看自己客户的标签值,则需要对客户进行行级权限管控。
解决方案(动态行级权限):

  1. 新加工一列标签,叫“客户所属客户经理”

Image

  1. 在“用户管理”中(客户经理是该平台的登录用户),用户属性列中,有一列可以与上述“所属客户经理”的值是同样的,如果没有的话,可以通过“扩展用户标识”功能增加一列。

Image

  1. 在行级权限中配置“动态行级权限”

规则:标签(所属客户经理)= 用户姓名 标签(所属营业部)=客户经理所属营业部。
后续去查询时,SQL语句中会根据当前登录用户动态替换用户姓名,实现数据的权限控制。
Image

数据权限配置入口:
Image

参考文档:数据授权。
数据授权