使用非结构数据打标功能前,您需要先将待打标签的非结构化数据创建为VeCDP的数据集。目前暂不支持直接将非结构化数据导入至VeCDP作为数据集,您需先将非结构化数据存储至库表中,再通过对接库表来创建VeCDP的数据集。 本文为您介绍如何准备数据。
将非结构化数据导入库表时,需确保库表包含以下任一类型字段:
以下以企业客服对话作为示例,示意几个典型场景下的数据准备工作。
若对话数据已将语音转为文本,则可将对话内容文本直接存储在库表中,需至少保留2个字段,id列和内容列,如下所示。
在客户数据平台CDP控制台,选择数据管理-数据连接,具体操作步骤请参见常见数据源接入和数据输入。
若对话数据只有原始语音,需要将语音文件导入对象存储,并将URL存储在库表中,需至少保留2个字段,id列和内容列。在客户数据平台CDP控制台,选择数据管理-数据连接,具体操作步骤请参见常见数据源接入和数据输入。
说明
当前非结构化数据暂不支持直接处理音视频原文件的数据,因此在后续打标前您还需调用音视频文件转文本的OpenAPI进行数据处理,整体会影响打标功能的流畅性,因此暂不建议使用此种方式。
近期非机构化打标功能即将能完整支持对音视频原文件的直接处理,后续此种方式即可顺畅进行打标,敬请关注后续功能上线。
说明
使用数据源直接接入企微会话数据时,需要您的企业微信开通了对应对接的功能。