数据输入,是用户开始进行可视化知识处理的任务处理的开端,需要选择一定的数据连接,实现从数据源中获取数据输入,进而可以选择数据清洗算子或者其他处理方式。
以MySQL数据连接的数据输入为例,将输入数据集推动到画布中,点击该输入算子。可以看到数据源信息,并且设置抽取的方式,进行分区字段筛选和非分区字段筛选,目前非分区字段筛选已经支持“且”与“或”的筛选逻辑,用户可以基于数据源进一步自由过滤数据。此外还可以设置抽取参数,设置预览的数据量等。
完成以上基本的数据输入处理后,用户可以进一步选择数据清洗或者特征工程等算子,实现多样的数据加工与处理。
可视化知识处理支持对大部分离线存储的数据输入做自定义SQL,实现基本的数据加工。在任务创建的数据连接环节,如果用户选择了数据集,那么在左侧画布中会显示:自定义SQL(离线任务可显示)、可视化建模数据集、智能数据洞察数据集、客户数据平台数据集(如同时购买并部署该产品)。其中自定义SQL简介如下:


