原【项目中心-数据输出任务】从1.22版本开始不再维护,请将历史任务迁移至升级后的模块【营销应用-数据输出】
数据输出模块支持将客户下游系统对接VeCDP,用户可以将在VeCDP上创建的数据数据输出到如自有数据库,以便进行灵活处理应用或分析工作。
输出内容 | 说明 | 支持的输出类型 |
|---|---|---|
分群 | 全量主体+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型) | 全量宽表输出 |
指定主体(支持选择多个分群)+附带信息(包含:标签、主体属性、行为事件、业务明细、ID类型) | 全量宽表输出 | |
标签 | 全量主体离线&实时标签结果表标签结果+ID类型 | 全量宽表输出 |
主体属性 | 全量主体属性+ID类型 | 全量宽表输出 |
行为属性 | 全量主体行为属性+ID类型 | 全量宽表输出 |
业务明细 | 全量主体业务明细+ID类型 | 全量宽表输出 |
说明
开启方式:进入配置中心,搜索配置 data_asset_output_v2.platform_list ,追加对应通道 code。
推荐使用,默认支持的配置项:
类别 | 存储 | 配置项名称 | 支持TTL | 支持的文本格式 | 表名 | 列名 | 不支持类型 | 以字母开头 | 支持的产品版本 | 附注 |
|---|---|---|---|---|---|---|---|---|---|---|
内置存储 | 内置Hive |
| 支持 | / | 小写字母、数字、下划线 | 不支持array | 必须 |
| ||
内置存储 | 内置HDFS |
| 不支持 | JSON, Parquet, ORC, CSV | / | 小写字母、数字、下划线 | / | 必须 |
| |
三方存储 | 火山云对象存储 |
| 不支持 | JSON, Parquet, ORC, CSV | / | 小写字母、数字、下划线 | / | 必须 |
| |
三方存储 | 阿里云对象存储 |
| 不支持 | JSON, Parquet, ORC, CSV | / | 小写字母、数字、下划线 | / | 必须 |
| |
三方存储 | 腾讯云对象存储 |
| 不支持 | JSON, Parquet, ORC, CSV | / | 小写字母、数字、下划线 | / | 必须 |
|
不推荐,即将停用的服务:
说明
若需要输出到外部存储,建议您输出到外部TOS/COS/OSS。若还不满足,您可以联系火山引擎技术人员测试开通以下服务。
类别 | 存储 | 配置项名称 | 支持TTL | 表名 | 列名 | 不支持类型 | 以字母开头 | 支持的产品版本 | 附注 |
|---|---|---|---|---|---|---|---|---|---|
外置存储 | 自定义输出 |
| 不支持 | / | / | / | / |
| 需要您自行开发Jar包实现,具体操作请参见自定义输出。 |
外置存储 | MaxCompute |
| 不支持 | 大小写字母、数字、下划线 | 大写字母、数字、下划线、中文 | / | 必须 |
| 不推荐,兼容性欠佳。 |
外置存储 | Oracle |
| 支持 | 大写字母、数字、下划线、中文 | 大写字母、数字、下划线、中文 | 不支持array\map | 必须 |
| 不推荐,兼容性欠佳。 |
外置存储 | OceanBase-Oracle |
| 支持 | 大写字母、数字、下划线、中文 | 大写字母、数字、下划线、中文 | 不支持array\map | 必须 |
| 不推荐,兼容性欠佳。 |
外置存储 | OceanBase-Mysql |
| 支持 | 大写字母、数字、下划线、中文 | 数字、下划线、中文 | 不支持array\map | 必须 |
| 不推荐,兼容性欠佳。 |
外置存储 | 外置Hive |
| 支持 | 小写字母、数字、下划线 | 小写字母,数字,下划线 | / | 必须 |
|
|
第一步:通道配置(在项目中心>通道配置中,完成第三方存储、LAS、外置Hive的通道配置)
第二步:创建数据输出任务(在营销应用>数据输出中,新建数据输出任务,配置输出内容、输出频率、输出账号、任务依赖等)
在VeCDP控制台,点击 项目中心 > 通道管理 ,在第三方渠道页面选择 添加通道应用 。支持火山云对象存储、阿里云对象存储、腾讯云对象存储、外置hive和LAS账号渠道的绑定
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择火山云对象存储, 准确填写对应信息后点击授权。
所需信息获取步骤如下:


在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择阿里云对象存储, 准确填写对应信息后点击授权。
所需信息获取步骤如下:


在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择腾讯云对象存储, 准确填写对应信息后点击授权。
所需信息获取步骤如下:



hiveServer2Url: jdbc:hive2://example.com:10000/;principal=hive/example.com@BYTEDANCE.COM hive user : cdp hdfs Address : hdfs://nameservice1 数据仓库: /commons/cdp principal: cdp@BYTEDANCE.COM
需提前准备好以下文件:
需将文件做以下处理
cdp.keytab, krb5.conf ,core_site.xml ,hdfs_site.xml (hdfs-site.xml、core-site.xml需要将"-"改成"_",否则会有问题)
hdfs-site.xml修改客户端创建目录的权限,默认为022 <property> <name>fs.permissions.umask-mode</name> <value>002</value> </property>
对应的路径为:
#platformId为三方授权时的id,在项目中心-三方渠道-hive找到相关id上传 /user/dp/cdp/data_asset/security/kerberos/${platformId}/${userKeyTable} /user/dp/cdp/data_asset/security/kerberos/${platformId}/krb5.conf /user/dp/cdp/data_asset/security/kerberos/${platformId}/core_site.xml /user/dp/cdp/data_asset/security/kerberos/${platformId}/hdfs_site.xml 例:如果id为 1 执行 hdfs dfs -mkdir -p /user/dp/cdp/data_asset/security/kerberos/1 执行 hdfs dfs -put -f cdp.keytab /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f krb5.conf /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f core_site.xml /user/dp/cdp/data_asset/security/kerberos/1 hdfs dfs -put -f hdfs_site.xml /user/dp/cdp/data_asset/security/kerberos/1
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择外置Hive, 准确填写对应信息后点击授权。
参数 | 说明 |
|---|---|
账号名称 | 输入Hive账号名称 |
hiveServer2Url | 输入hiveServer2的URL地址,支持使用zookeeper形式的地址 |
hdfs Address | 提供输出到外置HDFS的地址 |
数据仓库 | 指定hive metaStore的warehouse路径,例如,如果使用CDP作为标志,可以填写为“/user/hive/cdp_warehouse”。 |
鉴权方式 | 择适合的鉴权方式,目前支持“用户密码”和“kerberos鉴权”两种方式:
|
上传配置文件 | 上传必要的配置文件,包括但不限于 |
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择MaxCompute, 准确填写对应信息后点击授权。
配置项 | 说明 |
|---|---|
账号名称 | 输入自定义的账号名称,用于标识该通道应用。 |
endPoint | 输入MaxCompute服务连接的Endpoint地址。 |
tunnelUrl | 输入MaxCompute的Tunnel服务地址。 |
AccessKeyId | 输入用于访问MaxCompute的AccessKey ID。 |
AccessKeySecret | 输入与AccessKey ID配对的AccessKey Secret。 |
ProjectName | 输入要访问的MaxCompute项目(Project)的名称。 |
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择OceanBase-Mysql, 准确填写对应信息后点击授权。
配置项 | 说明 |
|---|---|
账号名称 | 为该通道应用设置一个自定义的名称,便于识别。此为必填项。 |
连接IP/HOST | 输入目标数据库的连接地址,可以是 IP 地址或域名。此为必填项。 |
端口Port | 输入目标数据库的连接端口。此为必填项。 |
账户User | 输入用于连接数据库的账户用户名。此为必填项。 |
帐号密码 | 输入账户用户对应的密码。此为必填项。 |
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择OceanBase-Oracle, 准确填写对应信息后点击授权。
配置项 | 说明 |
|---|---|
账号名称 | 设置账号的自定义名称,便于识别和管理。该项为必填项。 |
连接IP/HOST | 设置待连接数据库的IP地址或主机名。例如: |
端口Port | 设置待连接数据库的端口号。例如: |
账户User | 设置用于登录数据库的用户名。该项为必填项。 |
帐号密码 | 设置用于登录数据库的密码。该项为必填项。 |
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择Oracle, 准确填写对应信息后点击授权。
配置项 | 说明 |
|---|---|
账号名称 | 为该账号配置一个自定义的名称,便于识别。此项为必填项。 |
连接IP/HOST | 输入目标 Oracle 数据库的 IP 地址或主机名。此项为必填项。 |
端口Port | 输入目标 Oracle 数据库的连接端口号。此项为必填项。 |
账户User | 输入用于连接数据库的账户用户名。此项为必填项。 |
账号密码 | 输入指定账户对应的密码。此项为必填项。 |
目录名称 | 输入账号所属的目录名称。此项为必填项。 |
在通道管理页面,选择第三方通道页签,点击添加通道应用 ,选择自定义输出, 准确填写对应信息后点击授权。
配置项 | 说明 |
|---|---|
账号名称 | 设置账号名称。该项为必填项。 |
mainClass | 设置Jar包的mainClass。该项为必填项。 |
上传配置文件 | 点击点击上传按钮,上传自定义的Jar包文件。 |
在VeCDP控制台,选择 营销应用>数据输出。
点击新建任务>单主体数据输出,填写配置信息**。**
参数 | 说明 |
|---|---|
任务名称 | 为当前数据输出任务命名,支持中英文/数字/下划线 |
输出方式 | 支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。 |
当不添加附带信息时,可以输出全量宽表、全量高表、全量组合、增量高表、增量组合。
* 全量宽表输出:
| | | | \ |客户id |客群ID_001 |客群ID_002 | |---|---|---| | | | | \ |aaa |aaa |aaa | | | | | \ |bbb |NULL |bbb | * 全量高表输出: | | | | \ |客户id |asset_key |asset_value | |---|---|---| | | | | \ |aaa |segment_id |001 | | | | | \ |aaa |segment_id |002 | | | | | \ |bbb |segment_id |001 | * 全量组合输出: | | | | \ |客户id |asset_key |asset_value | |---|---|---| | | | | \ |aaa |segment_id |001 | | | | | \ |aaa |segment_id |002 | | | | | \ |bbb |segment_id |001 | * 增量高表输出: * 首次输出: | | | | | | \ |客户id |asset_key |asset_value |行变更类__meta_status__ |\ | | | |> 0: 全量数据 |\ | | | |> 1: 新增 |\ | | | |> 2: 删除 |行版本号 __meta_version__ |\ | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 | |---|---|---|---|---| | | | | | | \ |aaa |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |aaa |segment_id |002 |0 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |bbb |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx | * 若人群包001中删除客户aaa,人群包002新增客户ccc: | | | | | | \ |客户id |asset_key |asset_value |行变更类__meta_status__ |\ | | | |> 0: 全量数据 |\ | | | |> 1: 新增 |\ | | | |> 2: 删除 |行版本号 __meta_version__ |\ | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 | |---|---|---|---|---| | | | | | | \ |aaa |segment_id |001 |2 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |ccc |segment_id |002 |1 |xxxxx-xx-xx xx:xx:xx | * 增量组合输出: * 首次输出: | | | | | | \ |客户id |asset_key |asset_value |行变更类__meta_status__ |\ | | | |> 0: 全量数据 |\ | | | |> 1: 新增 |\ | | | |> 2: 删除 |行版本号 __meta_version__ |\ | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 | |---|---|---|---|---| | | | | | | \ |aaa |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |aaa |segment_id |002 |0 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |bbb |segment_id |001 |0 |xxxxx-xx-xx xx:xx:xx | * 若人群包001中删除客户aaa,人群包002新增客户ccc: | | | | | | \ |客户id |asset_key |asset_value |行变更类__meta_status__ |\ | | | |> 0: 全量数据 |\ | | | |> 1: 新增 |\ | | | |> 2: 删除 |行版本号 __meta_version__ |\ | | | | |> 本行数据的数据版本,一次输出任务对应一个版本号 | |---|---|---|---|---| | | | | | | \ |aaa |segment_id |001 |2 |xxxxx-xx-xx xx:xx:xx | | | | | | | \ |ccc |segment_id |002 |1 |xxxxx-xx-xx xx:xx:xx |
全量宽表输出:
客户id | 客群ID_001 | 客群ID_002 | tag_1 | tag_2 |
|---|---|---|---|---|
aaa | aaa | aaa | xx | |
bbb | NULL | bbb | xx | xx |
全量组合输出:
客户id | asset_key | asset_value | tag_1 | tag_2 |
|---|---|---|---|---|
aaa | segment_id | 001 | xx | |
aaa | segment_id | 002 | xx | |
bbb | segment_id | 001 | xx | xx |
增量组合输出:
首次输出:
客户id | asset_key | asset_value | tag_1 | tag_2 | 行变更类__meta_status__
| 行版本号 meta_version
|
|---|---|---|---|---|---|---|
aaa | segment_id | 001 | xx | 0 | xxxxx-xx-xx xx:xx:xx | |
aaa | segment_id | 002 | xx | 0 | xxxxx-xx-xx xx:xx:xx | |
bbb | segment_id | 001 | xx | xx | 0 | xxxxx-xx-xx xx:xx:xx |
若人群包001中删除客户aaa,人群包002新增客户ccc:
客户id | asset_key | asset_value | tag_1 | tag_2 | 行变更类__meta_status__
| 行版本号 meta_version
|
|---|---|---|---|---|---|---|
aaa | segment_id | 001 | xx | 2 | xxxxx-xx-xx xx:xx:xx | |
ccc | segment_id | 002 | xx | xx | 1 | xxxxx-xx-xx xx:xx:xx |
支持全量宽表输出,输出的标签数据表结构的样例如下:
基准ID | XX_ID,如用户ID | 性别 | 年龄 | 会员等级 | 标签… | 业务日期 |
|---|---|---|---|---|---|---|
63528953748201638462087 | 531916 | 男 | 23 | 白金 | …… | 2023/6/13 |
63528372748201638462087 | 638042 | 男 | 45 | 黄金 | …… | 2023/6/14 |
63528953748629738462087 | 538274 | 男 | 23 | 白银 | …… | 2023/6/15 |
73628953748201638462087 | 442187 | 男 | 30 | 白银 | …… | 2023/6/16 |
支持全量高表输出,输出的标签数据表结构的样例如下:
基准ID | 标签ID | 标签值 | 业务日期 |
|---|---|---|---|
63528953748201638462087 | 23 | 男 | 2023/6/13 |
63528372748201638462087 | 45 | 25 | 2023/6/14 |
63528953748629738462087 | 21 | 大学 | 2023/6/15 |
73628953748201638462087 | 89 | 白金会员 | 2023/6/16 |


注意
需要与隐私安全-数据加解密功能结合使用,在隐私安全内配置完成后,才能在这里选择.
支持表结构预览数据和编辑。
参数 | 说明 |
|---|---|
字段类型 | 如int、string等 |
字段名称 | 输出的结果表的列名,支持用户自定义:
|
资产名称 | 用户选择的资产内容的名称,如标签名称 |
资产类型 | 用户选择的资产类型,如标签、分群、ID类型、属性等 |
资产ID | 用户选择的资产内容的ID,如分群ID、标签ID |

支持多主体数据输出,基于主体间的关联关系可以输出A主体信息及关联的B主体信息。
举例:输出【人】关联的【车】关联关系
操作:
在VeCDP控制台,选择 营销应用>数据输出。
点击新建任务>多主体数据输出。
填写基础信息。
参数 | 说明 |
|---|---|
任务名称 | 为当前数据输出任务命名,支持中英文/数字/下划线 |
输出方式 | 支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。 |
选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】
其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤。
举例:输出【人】关联的【车】关联关系,同时输出【车】的标签
操作:
在VeCDP控制台,选择 营销应用>数据输出。
点击新建任务>多主体数据输出。
填写基础信息。
参数 | 说明 |
|---|---|
任务名称 | 为当前数据输出任务命名,支持中英文/数字/下划线 |
输出方式 | 支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。 |
选择输出主体【人】,输出内容【分群】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】
其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤。
举例:输出【人】关联的【车】关联关系,同时输出【人】的信息和【车】的标签
操作:
在VeCDP控制台,选择 营销应用>数据输出。
点击新建任务>多主体数据输出。
填写基础信息。
参数 | 说明 |
|---|---|
任务名称 | 为当前数据输出任务命名,支持中英文/数字/下划线 |
输出方式 | 支持三方存储(包含火山云对象存储、阿里云对象存储、腾讯云对象存储)、外置存储(包含外置Hive、LAS、OceanBase Mysql、Oceanbase Oracle、Oracle、maxcompute)、内置存储(HDFS、内置Hive)等。 |
选择输出主体【人】,输出内容【分群】,同时附带信息【标签】;选择关联主体【车】,输出内容【分群】,同时附带信息【标签】。
其他信息配置和单主体场景相同,具体操作请参见单主体数据输出操作步骤。
说明
模板管理支持创建并应用模板,方便业务人员快速通过模板完成数据输出任务配置。