You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件

大数据研发治理套件

复制全文
下载 pdf
Pipeline 开发
可视化与代码驱动编排
复制全文
下载 pdf
可视化与代码驱动编排

DataLeap New IDE 提供可视化画布与YAML 代码两种 Pipeline 编排模式,两者实时双向同步,开发者可根据场景自由选择和切换。

两种编排模式

可视化画布模式

可视化画布以拖拽方式构建 Pipeline 的 DAG(有向无环图)结构,适合快速搭建工作流和直观理解任务依赖关系。

  • 核心特点
    • 所见即所得:拖拽 Activity 节点到画布上,用连线建立依赖关系,Pipeline 结构一目了然。
    • 交互式配置:点击节点即可弹出配置面板,填写引擎类型、参数、重试策略等属性。
    • 实时校验:画布编辑过程中自动检测循环依赖、必填项缺失等常见配置问题。
    • 布局自动调整:支持自动对齐与排列,保持 DAG 图形整洁。
  • 适用场景
    • 新建 Pipeline 时快速搭建整体流程框架。
    • 向非编码背景的团队成员展示数据管道结构。
    • 排查依赖关系问题时直观定位上下游链路。

YAML 代码模式

YAML 代码模式直接编辑 Pipeline 配置文件,适合批量修改、精细控制和代码审查。

  • 核心特点
    • 声明式定义:以结构化的 YAML 文件描述 Pipeline 的完整配置,便于版本管理和 Code Review。
    • 批量编辑高效:复制粘贴、查找替换、多行编辑等文本操作效率远高于逐个点击配置面板。
    • 模板化复用:可将成熟 Pipeline 的 YAML 作为模板,快速派生新的工作流。
    • 完整性保证:YAML 文件包含 Pipeline 的全部配置信息,不会遗漏隐藏选项。
  • 适用场景
    • 批量修改多个 Activity 的参数或引擎配置。
    • 通过 Merge Request 进行 Pipeline 变更的 Code Review。
    • 复制已有 Pipeline 配置快速创建新管道。
    • 排查配置细节问题。

双向同步机制

可视化画布与 YAML 配置文件之间保持实时双向同步:

操作方向

行为说明

画布 → YAML

在画布上拖拽节点、连线、修改属性并保存后,对应的 YAML 配置文件自动更新。

YAML → 画布

在代码编辑器中修改 YAML 并保存后,画布自动刷新节点布局和连线关系。

  • 同步规则
    • 画布上每个节点对应 YAML 中 spec.activities 列表的一个条目。
    • 节点之间的连线对应 Activity 的 dependsOn.activities 配置。
    • 节点在画布上的位置信息存储在 Activity 的 position 字段(xy 坐标)。
    • 触发配置、参数、变量、数据产出等信息仅在配置面板或 YAML 中编辑,不直接体现在画布连线上。
  • 注意事项
    • 切换模式时无需手动保存,同步是即时的
    • 若 YAML 文件存在语法错误(如缩进不正确、字段类型不匹配),画布将无法正常渲染,需先修复 YAML 中的语法问题
    • 建议在画布模式下完成整体结构搭建,再切换到 YAML 模式做精细配置调整

模式选择建议

场景

推荐模式

说明

新建 Pipeline

画布

拖拽式搭建更高效直观。

批量修改参数

YAML

文本操作效率更高。

Code Review

YAML

Git diff 清晰展示配置变更。

调试依赖关系

画布

可视化展示上下游链路。

复制已有管道

YAML

复制 YAML 文件并修改关键字段。

跨团队沟通

画布

非技术人员也能理解流程图。

最近更新时间:2026.06.12 11:44:16
这个页面对您有帮助吗?
有用
有用
无用
无用