You need to enable JavaScript to run this app.
导航
数据准备
最近更新时间:2025.10.16 14:53:41首次发布时间:2025.10.16 14:53:41
复制全文
我的收藏
有用
有用
无用
无用

使用非结构化数据打标功能前,您需要先将待打标签的非结构化数据创建为VeCDP的数据集。目前暂不支持直接将非结构化数据导入至VeCDP作为数据集,您需先将非结构化数据存储至库表中,再通过对接库表来创建VeCDP的数据集。 本文为您介绍如何准备数据。

操作说明

将非结构化数据导入库表时,需确保库表包含以下任一类型字段:

  • 文本字段:直接存储为文本内容。
  • 音视频 / 文件 URL 字段:音视频文件的访问地址(即转为文本形式,推荐),存储音视频原文件(不推荐)。

以下以企业客服对话作为示例,示意几个典型场景下的数据准备工作。

外呼对话提取(转为文本,推荐)

若对话数据已将语音转为文本,则可将对话内容文本直接存储在库表中,需至少保留2个字段,id列和内容列,如下所示。
在客户数据平台CDP控制台,选择数据管理-数据连接,具体操作步骤请参见常见数据源接入数据输入
Image

外呼对话提取(音频原件,不推荐)

若对话数据只有原始语音,需要将语音文件导入对象存储,并将URL存储在库表中,需至少保留2个字段,id列和内容列。在客户数据平台CDP控制台,选择数据管理-数据连接,具体操作步骤请参见常见数据源接入数据输入
Image

说明

当前非结构化数据暂不支持直接处理音视频原文件的数据,因此在后续打标前您还需调用音视频文件转文本的OpenAPI进行数据处理,整体会影响打标功能的流畅性,因此暂不建议使用此种方式。

企业微信会话提取
  • 若企微会话存档数据此前已接入至VeCDP,则直接从数据库表读取即可,需至少保留2个字段,id列和内容列。 在客户数据平台CDP控制台,选择数据管理-数据连接,具体操作步骤请参见常见数据源接入数据输入
    Image
  • 若企微会话存档数据还未接入VeCDP,则可以从VeCDP的数据源直接接入。 在客户数据平台CDP控制台,选择数据管理-数据连接,搜索企业微信,具体操作步骤请参见企业微信数据连接
    Image

    说明

    使用数据源直接接入企微会话数据时,需要您的企业微信开通了对应对接的功能。

下一步

创建任务