为了满足日常的数据接入和开发诉求,CDP提供了 数据融合 模块来帮助数据开发人员进行数据处理工作。数据融合模块是CDP进行数据处理的主要功能模块,包括可视化建模、元数据管理、ID图谱构建、数据集、数据连接等功能。
在CDP中完成数据接入和开发工作,主要有以下几个步骤:
步骤 | 能力介绍 | 该模块必须完成的基础工作 | 参考图 |
---|---|---|---|
第一步:原始数据接入 | 系统提供20+种数据连接方式,方便企业将数据接入CDP系统中使用,包括但不限于关系型数据库(如:MySql、Oracle、SQL Server、DB2等),大数据平台(如:Hive,Impala、Clickhouse等),MPP数据库(Postgre等),流式数据库(Kafka等)、文本数据(Excel、CSV)、飞书表格、API接口等。不仅能够对接客户内部各业务公司客户数据和业务数据接入(如:会员系统、会员中台系统等),还可以对接官方网站、APP、公众号、企业微信、巨量引擎等数据源。 | 需完成:将所需数据通过【数据连接】模块接入系统。 | |
第二步:数据清洗和处理 | 原始数据接入CDP后无法直接使用,需要进行数据源编辑与数据的清洗。 | 需完成:
| |
第三步:数据打通,构建OneID体系 | 系统支持可视化地配置IDmapping逻辑,用户可以根据数据来源、数据完整度,实际业务规则设置多源数据匹配过程中的优先级,建立用户唯一标识(即OneID)。 | 根据业务场景判断,完成:
| |
第四步:完成数据登记与管理 | 系统提供统一的元数据管理能力,包括数据源登记、行为事件、主体属性、明细数据、渠道数据的管理。这里登记完成的数据源,即后续建标签、圈人时可用的数据源。 | 需完成:
|