任务创建,是指可视化知识处理任务的创建环节,通常包含新建任务、数据连接等步骤。可视化知识处理任务支持抽取数据源中的数据,通过拖拽形式添加数据处理节点,将处理完成的数据输出到目标源中。
说明
本文将结合产品实操界面介绍 离线任务 的创建步骤。

在可视化知识处理任务编辑页面,提供多样化的算子模板,点击 全部模板 可快速查看。
每个模板均支持 预览 或 应用 。
点击 预览 ,将详细介绍当前算子模板内置的样例数据、场景说明、使用到的算子,点击 使用模板 可快速套用。
使用模板后,系统将展示使用系统样例数据处理对应应用场景的详细配置,帮助用户进一步了解当前算子的能力及使用方式。
新建数据连接。 在新建任务页面,点击左上方的加号,添加数据连接;可以选择添加多种类型的数据连接,平台支持对大部分离线存储做自定义SQL。
注意
如果选择了数据集,在左侧画布中会加载:自定义SQL、可视化建模数据集、客户数据平台数据集:
移除数据连接。 可视化建模任务创建页面的数据连接列表中,点击具体某个数据连接右侧的删除按钮,即可移除数据连接。
通过点击节点右侧加号添加并配置处理节点,拖拽上一节点右侧加号和下一节点左侧原点连线,配置节点流转关系。点击“应用”后可展开处理后的数据结果预览。
如下图所示,点击输入数据算子块的输出+号,展开操作节点:输出、数据清洗、特色专区算子,点击其中一类,则可看到可以使用的算子。
说明
常用算子如下:
常规数据处理
AI数据挖掘
添加节点

添加分支: 点击算子卡片中的“+”,展开下拉菜单并添加新分支。
插入节点: 点击连线中的“+”,展开下拉菜单并插入节点
添加连线: 按住前一个算子右侧的输出点,将连线拖拽到后一个算子左侧的输入点上
切换节点: 点击算子卡片中的更多按钮或右键算子卡片,展开下拉菜单并切换节点 删除节点: 点击算子卡片中的更多按钮或右键算子卡片,展开下拉菜单并删除节点
在实际使用中,可视化建模算子支持增加文字描述,帮助用户更清晰地了解当前算子的备注信息。
可视化知识处理任务创建页面,支持自由布局与网格布局切换,灵活调整任务各节点的布局。
可视化知识处理新建任务页面,支持统一展示任务异常节点,辅助排查任务问题。
可视化知识处理任务创建页面,也支持通过点击Back或Delete键执行算子删除操作,提高数据清洗效率。
在可视化知识处理任务的编辑页面,选择数据连接后,支持便捷的预览能力。用户可预览 明细数据、表结构、数据探查 。点击每列数据的 “▼”按钮 ,支持快速选择算子,进行数据处理。如下图所示:
在预览中,提供数据清洗建议,用户点击后可一键完成清洗,提高数据清洗的效率。如下图所示:
在可视化知识处理任务的编辑页面,打开数据预览时,在预览界面左下方,可针对预览进行即时编辑或设置。用户可以配置参与预览计算的数据量(默认不超过1000000行),支持自定义行数或选择全量数据。配置后,预览将进行实时刷新。如下图所示:
创建离线可视化知识处理任务时,在算子预览和数据集详情页面,点击 下载 按钮即可进行下载离线数据集,方便用户将数据导出进行本地分析或进一步处理,提升数据的可扩展性。
配置中可以选中某节点并运行节点,进行运行检查。需注意的是,当上游节点更改后,必须重新执行上游节点后才能执行当前及下游节点。

节点执行完成后,节点旁会有绿色对号标记,表示当前节点已完成执行。
输出方式有:输出数据集、输出标签、导入知识引擎
输出数据集
已支持输出数据集:以Hive、ClickHouse
存储的数据集

监控配置
可设置数据结果告警规则:
监控项 | 说明 |
|---|---|
差异百分比(相比前一天) | 计算公式:(昨天数据行数-前天数据行数)/前天数据行数; |
差异百分比(相比前七天平均) | 计算公式:(昨天数据行数-近7天数据行数平均值)/近7天数据行数平均值; |
差异百分比(相比上月同期) | 计算公式:(昨天数据行数-上月同期数据行数)/上月同期数据行数; |
差异百分比(相比上周同期) | 计算公式:(昨天数据行数-上周同期数据行数)/上周同期数据行数; |

保存任务配置,点击左上角返回可跳转到任务详情。
返回可视化知识处理页面,点击当前任务的**「运行记录」**,可以手动运行。
常见问题
Q1:创建离线可视化知识处理任务时,系统时间参数支持${month}、${year}系统参数吗?
支持。如下图所示: