You need to enable JavaScript to run this app.
客户数据平台(私有化)

客户数据平台(私有化)

复制全文
资产输出
数据输出
复制全文
数据输出

原【项目中心-数据输出任务】从1.22版本开始不再维护,请将历史任务迁移至升级后的模块【营销应用-数据输出】

数据输出模块支持将客户下游系统对接VeCDP,用户可以将在VeCDP上创建的数据数据输出到如自有数据库,以便进行灵活处理应用或分析工作。

使用限制
  • 任务创建者: 需要具备功能权限(即项目中心-权限-编辑数据输出任务的权限)+ 资源权限(需要用到的标签&属性的权限)。具体操作请参见按用户管理
    Image
  • 数据使用者: 需要具有数据行权限

能力说明

支持输出的内容说明

输出内容

说明

支持的输出类型

分群

全量主体+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型)

全量宽表输出
增量宽表输出

指定主体(支持选择多个分群)+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型)

全量宽表输出
全量高表输出
全量组合输出
增量宽表输出
增量高表输出
增量组合输出

标签

全量主体离线&实时标签结果表标签结果+ID类型

全量宽表输出
全量高表输出

主体属性

全量主体属性+ID类型

全量宽表输出

行为属性

全量主体行为属性+ID类型

全量宽表输出

业务明细

全量主体业务明细+ID类型

全量宽表输出

说明

  • 高表是指行多列少的表,一行中的数据量较少,行数多
  • 宽表是指列多行少的表,一行中的数据量较大,行数少
  • 输出频率均支持定时输出(支持天、周、月)或 单次输出

支持输出的下游存储

开启方式:进入配置中心,搜索配置 data_asset_output_v2.platform_list ,追加对应通道 code。

  • 推荐使用,默认支持的配置项:

    类别

    存储

    配置项名称

    支持TTL

    支持的文本格式

    表名

    列名

    不支持类型

    以字母开头

    支持的产品版本

    附注

    内置存储

    内置Hive

    innerHive

    支持

    /

    小写字母、数字、下划线

    不支持array

    必须

    • 私有化:V1.19.2及以上
    • SaaS托管账号:V1.20.1及以上

    推荐使用此方法。您可以通过可视化建模从内置hive输出到外置存储,具体操作请参见输出到数据集外部输出

    内置存储

    内置HDFS

    hdfs

    不支持

    JSON, Parquet, ORC, CSV

    /

    小写字母、数字、下划线

    /

    必须

    • 私有化:V1.19.2及以上
    • SaaS托管账号:V1.20.1及以上

    三方存储

    火山云对象存储

    volcEngineOss

    不支持

    JSON, Parquet, ORC, CSV

    /

    小写字母、数字、下划线

    /

    必须

    • 私有化:V1.19.2及以上
    • SaaS托管账号:V1.20.1及以上
    • SaaS非托管账号:V1.20.1及以上

    三方存储

    阿里云对象存储

    aliOss

    不支持

    JSON, Parquet, ORC, CSV

    /

    小写字母、数字、下划线

    /

    必须

    • 私有化:V1.19.2及以上
    • SaaS托管账号:V1.20.1及以上
    • SaaS非托管账号:V1.20.1及以上

    三方存储

    腾讯云对象存储

    tencentOss

    不支持

    JSON, Parquet, ORC, CSV

    /

    小写字母、数字、下划线

    /

    必须

    • 私有化:V1.19.2及以上
    • SaaS托管账号:V1.20.1及以上
    • SaaS非托管账号:V1.20.1及以上
  • 不推荐,即将停用的服务:

    说明

    若需要输出到外部存储,建议您输出到外部TOS/COS/OSS。若还不满足,您可以联系火山引擎技术人员测试开通以下服务。

    类别

    存储

    配置项名称

    支持TTL

    表名

    列名

    不支持类型

    以字母开头

    支持的产品版本

    附注

    外置存储

    自定义输出

    udfOutput

    不支持

    /

    /

    /

    /

    • 私有化:V1.23.0~V1.28.0

    需要您自行开发Jar包实现,具体操作请参见自定义输出

    外置存储

    MaxCompute

    maxCompute

    不支持

    大小写字母、数字、下划线

    大写字母、数字、下划线、中文

    /

    必须

    • SaaS:V1.23.0~V1.28.0

    不推荐,兼容性欠佳。

    外置存储

    Oracle

    oracle

    支持

    大写字母、数字、下划线、中文

    大写字母、数字、下划线、中文

    不支持array\map

    必须

    • 私有化:V1.23.0~V1.28.0
    • SaaS:V1.23.0~V1.28.0

    不推荐,兼容性欠佳。

    外置存储

    OceanBase-Oracle

    oceanBaseOracle

    支持

    大写字母、数字、下划线、中文

    大写字母、数字、下划线、中文

    不支持array\map

    必须

    • 私有化:V1.23.0~V1.28.0
    • SaaS:V1.23.0~V1.28.0

    不推荐,兼容性欠佳。

    外置存储

    OceanBase-Mysql

    oceanBaseMysql

    支持

    大写字母、数字、下划线、中文

    数字、下划线、中文

    不支持array\map

    必须

    • 私有化:V1.23.0~V1.28.0
    • SaaS:V1.23.0~V1.28.0

    不推荐,兼容性欠佳。

    外置存储

    外置Hive

    externalHive

    支持

    小写字母、数字、下划线

    小写字母,数字,下划线

    /

    必须

    • 私有化:V1.21.0~V1.28.0
    • 支持的Hive版本:1.2.x、2.3.x、3.1.x、4.0.x(不推荐)
    • 支持的Hadoop版本:2.7.x、2.10.x、3.3.6

单主体数据输出操作步骤

第一步:通道配置(在项目中心>通道配置中,完成第三方存储、LAS、外置Hive的通道配置)
第二步:创建数据输出任务(在营销应用>数据输出中,新建数据输出任务,配置输出内容、输出频率、输出账号、任务依赖等)

第一步 完成通道配置

在VeCDP控制台,点击 项目中心 > 通道管理 ,在第三方渠道页面选择 添加通道应用 。支持火山云对象存储、阿里云对象存储、腾讯云对象存储、外置hive和LAS账号渠道的绑定
Image

火山云对象存储

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择火山云对象存储, 准确填写对应信息后点击授权
Image
所需信息获取步骤如下:

  1. 登录火山云官网,登录账号。
  2. 点击头像,选择 API访问密钥 ,获取Accesskey、AccessKeySecret信息。
    Image
  3. 创建存储桶,具体操作请参见创建存储桶
    Image
  4. 获取桶信息。在左侧导航栏,单击概览,在右侧页面查看该存储桶的用量概览、基本信息和访问域名,在该页面获取OSS地址、Bucket名称等信息。
    Image

阿里云对象存储

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择阿里云对象存储, 准确填写对应信息后点击授权
Image
所需信息获取步骤如下:

  1. 登录阿里云官网,登录账号。
  2. 访问控制页面,获取Accesskey,AccessKeySecret信息。
    Image
  3. 创建存储空间,完成后可以 获取存储空间地域信息 ,取得OSS地址、Bucket名称等信息。
    Image

腾讯云对象存储

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择腾讯云对象存储, 准确填写对应信息后点击授权
Image
所需信息获取步骤如下:

  1. 登录腾讯云官网,登录账号。
  2. 访问管理页面,获取Accesskey,AccessKeySecret信息。
    Image
  3. 在左侧导航中,单击存储桶列表,进入存储桶列表页面,单击创建存储桶。具体操作请参见创建存储桶
    Image
  4. 存储桶列表页面,获取Bucket名称、Bucket Region等信息。
    Image

外置Hive

外置hive添加通道示例(Krb5鉴权)

hiveServer2Url: jdbc:hive2://example.com:10000/;principal=hive/example.com@BYTEDANCE.COM

hive user : cdp

hdfs Address : hdfs://nameservice1

数据仓库: /commons/cdp

principal: cdp@BYTEDANCE.COM
  1. 刷新界面,记录账户ID/账户组ID
  2. 上传配置文件
    1. 需提前准备好以下文件:

      • keytab文件,例 cdp.keytab
      • core-site.xml
      • hdfs-site.xml
      • krb5.conf
    2. 需将文件做以下处理
      cdp.keytab, krb5.conf ,core_site.xml ,hdfs_site.xml (hdfs-site.xml、core-site.xml需要将"-"改成"_",否则会有问题)

      hdfs-site.xml修改客户端创建目录的权限,默认为022
      
        <property>
          <name>fs.permissions.umask-mode</name>
          <value>002</value>
        </property>
      

      对应的路径为:

      #platformId为三方授权时的id,在项目中心-三方渠道-hive找到相关id上传
      
      /user/dp/cdp/data_asset/security/kerberos/${platformId}/${userKeyTable}
      /user/dp/cdp/data_asset/security/kerberos/${platformId}/krb5.conf
      /user/dp/cdp/data_asset/security/kerberos/${platformId}/core_site.xml
      /user/dp/cdp/data_asset/security/kerberos/${platformId}/hdfs_site.xml
      
      例:如果id为 1
      执行 hdfs dfs -mkdir -p /user/dp/cdp/data_asset/security/kerberos/1
      执行 hdfs dfs -put -f cdp.keytab /user/dp/cdp/data_asset/security/kerberos/1
          hdfs dfs -put -f krb5.conf /user/dp/cdp/data_asset/security/kerberos/1
          hdfs dfs -put -f core_site.xml /user/dp/cdp/data_asset/security/kerberos/1
          hdfs dfs -put -f hdfs_site.xml /user/dp/cdp/data_asset/security/kerberos/1
      

操作流程

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择外置Hive, 准确填写对应信息后点击授权
Image

参数

说明

账号名称

输入Hive账号名称

hiveServer2Url

输入hiveServer2的URL地址,支持使用zookeeper形式的地址

hdfs Address

提供输出到外置HDFS的地址

数据仓库

指定hive metaStore的warehouse路径,例如,如果使用CDP作为标志,可以填写为“/user/hive/cdp_warehouse”。

鉴权方式

择适合的鉴权方式,目前支持“用户密码”和“kerberos鉴权”两种方式:

  • 用户密码:输入hive用户的用户名和密码。
  • kerberos鉴权:需要提供keytable文件对应的principal信息

上传配置文件

上传必要的配置文件,包括但不限于hdfs_site.xml, core_site.xml, krb5.conf, xxx.keytab(上传的文件 xxx.keytab,需要先重命名为 cdp.keytab 再上传)文件。注意,文件名不支持使用中划线。

MaxCompute

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择MaxCompute, 准确填写对应信息后点击授权
Image

配置项

说明

账号名称

输入自定义的账号名称,用于标识该通道应用。

endPoint

输入MaxCompute服务连接的Endpoint地址。
例如:http://service.odps.example.com/api

tunnelUrl

输入MaxCompute的Tunnel服务地址。
例如:http://dt.odps.example.com

AccessKeyId

输入用于访问MaxCompute的AccessKey ID。

AccessKeySecret

输入与AccessKey ID配对的AccessKey Secret。

ProjectName

输入要访问的MaxCompute项目(Project)的名称。

OceanBase-Mysql

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择OceanBase-Mysql, 准确填写对应信息后点击授权
Image

配置项

说明

账号名称

为该通道应用设置一个自定义的名称,便于识别。此为必填项。

连接IP/HOST

输入目标数据库的连接地址,可以是 IP 地址或域名。此为必填项。
例如:example.domain.com

端口Port

输入目标数据库的连接端口。此为必填项。
例如:3306

账户User

输入用于连接数据库的账户用户名。此为必填项。

帐号密码

输入账户用户对应的密码。此为必填项。

OceanBase-Oracle

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择OceanBase-Oracle, 准确填写对应信息后点击授权
Image

配置项

说明

账号名称

设置账号的自定义名称,便于识别和管理。该项为必填项。

连接IP/HOST

设置待连接数据库的IP地址或主机名。例如:example.aliyuncs.com。该项为必填项。

端口Port

设置待连接数据库的端口号。例如:3306。该项为必填项。

账户User

设置用于登录数据库的用户名。该项为必填项。

帐号密码

设置用于登录数据库的密码。该项为必填项。

Oracle

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择Oracle, 准确填写对应信息后点击授权
Image

配置项

说明

账号名称

为该账号配置一个自定义的名称,便于识别。此项为必填项。

连接IP/HOST

输入目标 Oracle 数据库的 IP 地址或主机名。此项为必填项。
示例:123.123.12.123

端口Port

输入目标 Oracle 数据库的连接端口号。此项为必填项。
Oracle 数据库的默认端口通常为 1521。

账户User

输入用于连接数据库的账户用户名。此项为必填项。

账号密码

输入指定账户对应的密码。此项为必填项。

目录名称

输入账号所属的目录名称。此项为必填项。

自定义输出

通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择自定义输出, 准确填写对应信息后点击授权
Image

配置项

说明

账号名称

设置账号名称。该项为必填项。

mainClass

设置Jar包的mainClass。该项为必填项。
指定Jar包中包含 main 方法的完整类名,作为程序的入口点。例如:com.example.MyMainClass

上传配置文件

点击点击上传按钮,上传自定义的Jar包文件。

第二步 配置基础信息

  1. 在VeCDP控制台,选择 营销应用>数据输出。
    Image

  2. 点击新建任务>单主体数据输出,填写配置信息**。**
    Image

    参数

    说明

    任务名称

    为当前数据输出任务命名,支持中英文/数字/下划线

    输出方式

    支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。

第三步 配置输出内容

1.输出「分群」数据资产

Image

  1. 输出内容: 选择 分群 并勾选需要输出的分群。
    • 输出方式: 用户可以选择输出全量ID或仅输出部分ID,以适应不同的分析和运营需求。
    • 附带信息: 在输出分群时,用户可以添加额外的附带信息,如标签、主体属性、行为事件、业务明细,增强输出时的信息补充和理解。
  2. 多选输出ID类型: 输出时支持多选ID(ID图谱中引入的ID均可勾选),最多支持选择10个。
  3. 输出类型:全量宽表输出、全量高表输出、全量组合输出、增量高表输出、增量组合输出。
    • 当不添加附带信息时,可以输出全量宽表、全量高表、全量组合、增量高表、增量组合。
      Image
      * 全量宽表输出:

      | | | | \
         |客户id |客群ID_001 |客群ID_002 |
         |---|---|---|
         | | | | \
         |aaa |aaa |aaa |
         | | | | \
         |bbb |NULL |bbb |
      
      * 全量高表输出:
         
         | | | | \
         |客户id |asset_key |asset_value |
         |---|---|---|
         | | | | \
         |aaa |segment_id |001 |
         | | | | \
         |aaa |segment_id |002 |
         | | | | \
         |bbb |segment_id |001 |
      
      * 全量组合输出:
         
         | | | | \
         |客户id |asset_key |asset_value |
         |---|---|---|
         | | | | \
         |aaa |segment_id |001 |
         | | | | \
         |aaa |segment_id |002 |
         | | | | \
         |bbb |segment_id |001 |
      
      * 增量高表输出:
         * 首次输出:
            
            | | | | | | \
            |客户id |asset_key |asset_value |行变更类__meta_status__ |\
            | | | |> 0: 全量数据 |\
            | | | |> 1: 新增 |\
            | | | |> 2: 删除 |行版本号 __meta_version__ |\
            | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 |
            |---|---|---|---|---|
            | | | | | | \
            |aaa |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |aaa |segment_id |002 |0 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |bbb |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx |
      
         * 若人群包001中删除客户aaa,人群包002新增客户ccc:
            
            | | | | | | \
            |客户id |asset_key |asset_value |行变更类__meta_status__ |\
            | | | |> 0: 全量数据 |\
            | | | |> 1: 新增 |\
            | | | |> 2: 删除 |行版本号 __meta_version__ |\
            | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 |
            |---|---|---|---|---|
            | | | | | | \
            |aaa |segment_id |001 |2 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |ccc |segment_id |002 |1 |xxxxx-xx-xx xx:xx:xx |
      
      
      
      
      * 增量组合输出:
         * 首次输出:
            
            | | | | | | \
            |客户id |asset_key |asset_value |行变更类__meta_status__ |\
            | | | |> 0: 全量数据 |\
            | | | |> 1: 新增 |\
            | | | |> 2: 删除 |行版本号 __meta_version__ |\
            | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 |
            |---|---|---|---|---|
            | | | | | | \
            |aaa |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |aaa |segment_id |002 |0 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |bbb |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx |
      
         *  若人群包001中删除客户aaa,人群包002新增客户ccc:
            
            | | | | | | \
            |客户id |asset_key |asset_value |行变更类__meta_status__ |\
            | | | |> 0: 全量数据 |\
            | | | |> 1: 新增 |\
            | | | |> 2: 删除 |行版本号 __meta_version__ |\
            | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 |
            |---|---|---|---|---|
            | | | | | | \
            |aaa |segment_id |001 |2 |xxxxx-xx-xx xx:xx:xx |
            | | | | | | \
            |ccc |segment_id |002 |1 |xxxxx-xx-xx xx:xx:xx |
      
      • 当添加附带信息,例如标签时,只能输出全量宽表、全量组合、增量组合:
        Image
        • 全量宽表输出

          客户id

          客群ID_001

          客群ID_002

          tag_1

          tag_2

          aaa

          aaa

          aaa

          xx

          bbb

          NULL

          bbb

          xx

          xx

        • 全量组合输出

          客户id

          asset_key

          asset_value

          tag_1

          tag_2

          aaa

          segment_id

          001

          xx

          aaa

          segment_id

          002

          xx

          bbb

          segment_id

          001

          xx

          xx

        • 增量组合输出

          • 首次输出:

            客户id

            asset_key

            asset_value

            tag_1

            tag_2

            行变更类__meta_status__

            0: 全量数据
            1: 新增
            2: 删除

            行版本号 meta_version

            本行数据的数据版本,一次输出任务对应一个版本号

            aaa

            segment_id

            001

            xx

            0

            xxxxx-xx-xx xx:xx:xx

            aaa

            segment_id

            002

            xx

            0

            xxxxx-xx-xx xx:xx:xx

            bbb

            segment_id

            001

            xx

            xx

            0

            xxxxx-xx-xx xx:xx:xx

          • 若人群包001中删除客户aaa,人群包002新增客户ccc:

            客户id

            asset_key

            asset_value

            tag_1

            tag_2

            行变更类__meta_status__

            0: 全量数据
            1: 新增
            2: 删除

            行版本号 meta_version

            本行数据的数据版本,一次输出任务对应一个版本号

            aaa

            segment_id

            001

            xx

            2

            xxxxx-xx-xx xx:xx:xx

            ccc

            segment_id

            002

            xx

            xx

            1

            xxxxx-xx-xx xx:xx:xx

2.输出「标签」数据资产

Image

  1. 输出内容: 选择标签并勾选需要输出的标签。
  2. 选择ID类型: 支持多选ID信息作为附带信息一并输出。最多可以选择10个ID类型。
  3. 输出类型:
    • 支持全量宽表输出,输出的标签数据表结构的样例如下:

      基准ID

      XX_ID,如用户ID

      性别

      年龄

      会员等级

      标签…

      业务日期

      63528953748201638462087

      531916

      23

      白金

      ……

      2023/6/13

      63528372748201638462087

      638042

      45

      黄金

      ……

      2023/6/14

      63528953748629738462087

      538274

      23

      白银

      ……

      2023/6/15

      73628953748201638462087

      442187

      30

      白银

      ……

      2023/6/16

    • 支持全量高表输出,输出的标签数据表结构的样例如下:

      基准ID

      标签ID

      标签值

      业务日期

      63528953748201638462087

      23

      2023/6/13

      63528372748201638462087

      45

      25

      2023/6/14

      63528953748629738462087

      21

      大学

      2023/6/15

      73628953748201638462087

      89

      白金会员

      2023/6/16

3.输出「主体属性」数据资产

Image

  1. 输出内容: 选择主体属性并勾选需要输出的主体属性,最多可以选择5个数据档案对应的主体属性。
  2. 选择ID类型: 支持多选ID信息作为附带信息一并输出。最多可以选择10个ID类型。
  3. 输出类型: 支持全量宽表输出。

4.输出「行为属性」数据资产

Image

  1. 输出内容: 选择行为属性并勾选需要输出的行为属性。最多可以选择5个数据档案对应的行为属性。
  2. 选择ID类型: 支持多选ID信息作为附带信息一并输出。最多可以选择10个ID类型。
  3. 输出类型: 支持全量宽表输出。

5.输出「业务明细」数据资产

Image

  1. 输出内容: 选择 业务明细 并勾选需要输出的明细数据。最多可以选择5个数据档案对应的明细数据。
  2. 选择ID类型: 支持多选ID信息作为附带信息一并输出。最多可以选择10个ID类型。
  3. 输出类型: 支持全量宽表、高表输出。

第四步 输出方内容配置

1.输出至「第三方存储对象」

Image

  1. 输出账号: 即选择输出的下游存储渠道的账号名称。
  2. 输出频率:
    • 如果需要一次性数据输出,选择“单次输出”。
    • 如果需要定期数据输出,选择“定时输出”,并进一步选择输出周期(按天、周、月)。
  3. 输出文件夹名称:
    • 默认情况下,文件夹名称将由任务名称和时间戳组成,例如“111_20231104”。
    • 注意文件夹名称的最大长度限制为32个字符,且名称必须是唯一的。如果需要,可以修改默认名称。
    • 可以选择是否在文件夹名称后添加时间戳后缀。
  4. 存储格式: CSV、Parquet、ORC或JSON。
  5. 分隔符: 根据数据内容和需求,选择适合的分隔符,支持的分隔符包括逗号(,)、分号(;)、制表符(\t)和竖线(|)。
  6. 选择数据行权限: 如果需要基于用户权限进行数据输出,可以选择此选项。在弹出的列表中选择项目内的用户,系统将根据所选用户的数据行权限来输出相应的数据资产。

2.输出至「外置Hive、LAS、内置Hive」

Image

  1. 输出账号: 即选择输出的下游存储渠道的账号名称。
  2. 输出频率:
    • 如果需要一次性数据输出,选择“单次输出”。
    • 如果需要定期数据输出,选择“定时输出”,并进一步选择输出周期(按天、周、月)。
  3. 输出数据库: 填写数据输出到的数据库名称
  4. 输出数据表: 填写数据输出到的数据表名称。请确保数据表已存在或您有权限创建。
  5. 选择数据行权限: 如果需要基于用户权限进行数据输出,可以选择此选项。在弹出的列表中选择项目内的用户,系统将根据所选用户的数据行权限来输出相应的数据资产。

3.输出至「内置存储-HDFS」

Image

  1. 输出频率:
    • 如果需要一次性数据输出,选择“单次输出”。
    • 如果需要定期数据输出,选择“定时输出”,并进一步选择输出周期(按天、周、月)。
  2. 存储格式: CSV、Parquet、ORC或JSON。
  3. 分隔符: 根据数据内容和需求,选择适合的分隔符,支持的分隔符包括逗号(,)、分号(;)、制表符(\t)和竖线(|)。
  4. 输出路径: 填写数据将被输出到的HDFS路径。请确保路径格式正确,并且您有权限在该路径下创建文件。
  5. 选择数据行权限: 如果需要基于用户权限进行数据输出,可以选择此选项。在弹出的列表中选择项目内的用户,系统将根据所选用户的数据行权限来输出相应的数据资产。

4.输出至「外置存储」

Image

  1. 输出账号: 即选择输出的下游存储渠道的账号名称。
  2. 输出频率:
    • 如果需要一次性数据输出,选择“单次输出”。
    • 如果需要定期数据输出,选择“定时输出”,并进一步选择输出周期(按天、周、月)。
  3. 输出数据表: 填写数据输出到的数据表名称。请确保数据表已存在或您有权限创建。
  4. 数据生命周期:​可以设置数据项的生命周期,增强数据的可控性和安全性。
  5. 选择数据行权限: 如果需要基于用户权限进行数据输出,可以选择此选项。在弹出的列表中选择项目内的用户,系统将根据所选用户的数据行权限来输出相应的数据资产。

第五步 输出加密配置

Image

  1. 输出加密配置
    • 加密算法:提供多种加密算法,包括MD5、SHA256、AES/ECB/PKCS7Padding/128、AES/CBC/PKCS7Padding/128、AES/CFB/PKCS7Padding/128、DES。
    • 密文编码:支持BASE64和HEX两种编码方式。
  2. 数据加密处理策略
    • 若未在隐私加密模块登记加密信息,且数据输出选择加密,则直接对原字段值进行加密。
    • 若已登记加密信息,且为AES或DES,数据输出选择加密时,将先解密原字段,再按配置的加密方式重新加密。
    • 若已登记加密信息,且为MD5或SHA256,数据输出选择加密时,将在原字段基础上再次加密。
    • 若已登记加密信息,且为RSA,数据输出选择加密时,同MD5或SHA256处理方式。
    • 若已登记加密信息,但数据输出未选择加密,则按原字段输出。

注意

需要与隐私安全-数据加解密功能结合使用,在隐私安全内配置完成后,才能在这里选择.

第六步 输出数据预览

支持表结构预览数据和编辑。
Image

参数

说明

字段类型

如int、string等

字段名称

输出的结果表的列名,支持用户自定义:

  • 小写英文字母、数字、下划线(_),并且以小写英文字母开头
  • 最大长度为32个字符,名称不可重复

资产名称

用户选择的资产内容的名称,如标签名称

资产类型

用户选择的资产类型,如标签、分群、ID类型、属性等

资产ID

用户选择的资产内容的ID,如分群ID、标签ID

第七步 任务依赖配置

Image

  • 在任务依赖配置页,系统将自动展示与所选资产相关的上游依赖任务信息。
  • 对于每个上游依赖任务,系统会提供一个开关按钮,用户可以通过点击该按钮来开启或关闭任务依赖。开启依赖意味着当前任务的执行将依赖于上游任务的完成;关闭依赖则表示当前任务的执行不受上游任务状态的影响。

多主体数据输出操作步骤

支持多主体数据输出,基于主体间的关联关系可以输出A主体信息及关联的B主体信息。

场景1:输出A主体与B主体的关联关系

举例:输出【人】关联的【车】关联关系
操作

  1. 在VeCDP控制台,选择 营销应用>数据输出。
    Image

  2. 点击新建任务>多主体数据输出。
    Image

  3. 填写基础信息。
    Image

    参数

    说明

    任务名称

    为当前数据输出任务命名,支持中英文/数字/下划线

    输出方式

    支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。

  4. 选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】
    Image

  5. 其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤

场景2:输出A主体与B主体的关联关系,同时附带B主体的信息

举例:输出【人】关联的【车】关联关系,同时输出【车】的标签
操作

  1. 在VeCDP控制台,选择 营销应用>数据输出。
    Image

  2. 点击新建任务>多主体数据输出。
    Image

  3. 填写基础信息。
    Image

    参数

    说明

    任务名称

    为当前数据输出任务命名,支持中英文/数字/下划线

    输出方式

    支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。

  4. 选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】
    Image

  5. 其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤

场景3:输出A主体与B主体的关联关系,同时附带A主体的信息和B主体的信息

举例:输出【人】关联的【车】关联关系,同时输出【人】的信息和【车】的标签
操作

  1. 在VeCDP控制台,选择 营销应用>数据输出。
    Image

  2. 点击新建任务>多主体数据输出。
    Image

  3. 填写基础信息。
    Image

    参数

    说明

    任务名称

    为当前数据输出任务命名,支持中英文/数字/下划线

    输出方式

    支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。

  4. 选择输出主体【人】,输出内容【分群】,同时附带信息【标签】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】。
    Image

  5. 其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤

说明

  • A主体或B主体选择输出【分群】,则可支持输出全量ID或者指定分群的关联关系及附加信息。
  • A主体或B主体选择输出【标签】或【主体属性】,则输出全量ID的关联关系及附加信息。

模板管理

模板管理支持创建并应用模板,方便业务人员快速通过模板完成数据输出任务配置。

  1. 点击营销应用>数据输出,点击模板管理,​可查看历史创建的数据输出模板。
    Image
  2. 查看或删除历史创建的数据输出模板。
    Image
  3. 点击创建模板,​可新建数据输出模板。

Image

  1. 基础信息:
    • 任务名称: 为当前数据输出任务命名,支持中英文/数字/下划线
    • 输出方式:​内置存储(内置Hive)、 外置存储(自定义输出)。
  2. 输出内容和上述输出内容配置步骤相同,具体操作请参见单主体数据输出操作步骤
  3. 配置完成后的模板,可以在新建任务时,选择模板数据输出
    Image
最近更新时间:2025.12.22 18:17:49
这个页面对您有帮助吗?
有用
有用
无用
无用