DataLeap New IDE 提供可视化画布与YAML 代码两种 Pipeline 编排模式,两者实时双向同步,开发者可根据场景自由选择和切换。
两种编排模式
可视化画布模式
可视化画布以拖拽方式构建 Pipeline 的 DAG(有向无环图)结构,适合快速搭建工作流和直观理解任务依赖关系。
- 核心特点:
- 所见即所得:拖拽 Activity 节点到画布上,用连线建立依赖关系,Pipeline 结构一目了然。
- 交互式配置:点击节点即可弹出配置面板,填写引擎类型、参数、重试策略等属性。
- 实时校验:画布编辑过程中自动检测循环依赖、必填项缺失等常见配置问题。
- 布局自动调整:支持自动对齐与排列,保持 DAG 图形整洁。
- 适用场景:
- 新建 Pipeline 时快速搭建整体流程框架。
- 向非编码背景的团队成员展示数据管道结构。
- 排查依赖关系问题时直观定位上下游链路。
YAML 代码模式
YAML 代码模式直接编辑 Pipeline 配置文件,适合批量修改、精细控制和代码审查。
- 核心特点:
- 声明式定义:以结构化的 YAML 文件描述 Pipeline 的完整配置,便于版本管理和 Code Review。
- 批量编辑高效:复制粘贴、查找替换、多行编辑等文本操作效率远高于逐个点击配置面板。
- 模板化复用:可将成熟 Pipeline 的 YAML 作为模板,快速派生新的工作流。
- 完整性保证:YAML 文件包含 Pipeline 的全部配置信息,不会遗漏隐藏选项。
- 适用场景:
- 批量修改多个 Activity 的参数或引擎配置。
- 通过 Merge Request 进行 Pipeline 变更的 Code Review。
- 复制已有 Pipeline 配置快速创建新管道。
- 排查配置细节问题。
双向同步机制
可视化画布与 YAML 配置文件之间保持实时双向同步:
操作方向 | 行为说明 |
|---|
画布 → YAML | 在画布上拖拽节点、连线、修改属性并保存后,对应的 YAML 配置文件自动更新。 |
YAML → 画布 | 在代码编辑器中修改 YAML 并保存后,画布自动刷新节点布局和连线关系。 |
- 同步规则:
- 画布上每个节点对应 YAML 中
spec.activities 列表的一个条目。 - 节点之间的连线对应 Activity 的
dependsOn.activities 配置。 - 节点在画布上的位置信息存储在 Activity 的
position 字段(x、y 坐标)。 - 触发配置、参数、变量、数据产出等信息仅在配置面板或 YAML 中编辑,不直接体现在画布连线上。
- 注意事项:
- 切换模式时无需手动保存,同步是即时的
- 若 YAML 文件存在语法错误(如缩进不正确、字段类型不匹配),画布将无法正常渲染,需先修复 YAML 中的语法问题
- 建议在画布模式下完成整体结构搭建,再切换到 YAML 模式做精细配置调整
模式选择建议
场景 | 推荐模式 | 说明 |
|---|
新建 Pipeline | 画布 | 拖拽式搭建更高效直观。 |
批量修改参数 | YAML | 文本操作效率更高。 |
Code Review | YAML | Git diff 清晰展示配置变更。 |
调试依赖关系 | 画布 | 可视化展示上下游链路。 |
复制已有管道 | YAML | 复制 YAML 文件并修改关键字段。 |
跨团队沟通 | 画布 | 非技术人员也能理解流程图。 |