项目即工作空间,是开发工作的管理单元。本文将为您介绍如何创建新的项目。
约束限制
具备平台管理员角色权限的用户才可新建项目。用户赋权操作请参见角色管理。
前提条件
- 已注册相应类型的集群,相关操作请参见集群管理。
- Apache Hadoop、MinBase Hadoop 和 LAS三种类型已添加资源队列,相关操作请参见资源管理。
操作步骤
- 登录DataLeap控制台。
- 单击左侧导航栏的项目管理,进入项目管理页面。
- 单击新建项目按钮,弹出新建项目窗口。

- 参见参数说明设置以下项目配置信息后,单击确定按钮,完成项目创建。
参数说明
配置基本信息
基础相关参数说明如下表所示。其中名称前带 * 的参数为必填参数,名称前未带 * 的参数为可选参数。
参数 | 说明 |
|---|
*项目名称 | 创建项目的名称,按需设置。
仅可由汉字、字母、数字、下划线、或特殊字符.、[]、【】、()、()组成。 |
*Region | 当前 DataLeap 服务所属的地域信息。默认选择,无需设置。 |
*所有者 | 项目的所有者,下拉可选已有账号,支持输入账号关键词搜索。
所有者将默认被授予项目管理员角色。 |
*项目描述 | 项目有关的描述信息。 |
紧急联系人 | 项目的紧急联系人,下拉可选已有账号,支持输入账号关键词搜索,支持设置多个。 说明 - 紧急联系人将默认被授予项目管理员角色。
- 当项目下任务出现异常情况时,紧急联系人需要对本项目下的任务负责。
|
*项目权限 | 分为公开、私有两种。 对于私有项目,只有加入其成员列表,才可以查看。 |
数据源开发生产环境隔离 | 可选择是否开启数据源开发生产环境隔离。 - 若勾选开启隔离,则数据源支持开发生产环境隔离,开发环境任务配置和任务调试只能使用开发数据源,发布自动使用生产数据源。
- 若不勾选开启隔离,则默认简单模式只能注册生产数据源。
注意 项目一旦初始化配置后将不可再变更,请谨慎操作! |
配置项目管控信息
项目管控信息相关参数说明如下表所示。
参数 | 说明 |
|---|
*项目回溯控制 | 当无本项目编辑权限的用户,通过上游回溯本项目下的任务,确定是否需要审批。 - 若选择直接执行,则无本项目编辑权限用户可以直接发起深度回溯;
- 若选择审批同意后执行,则需要责任人审批发起的深度回溯。
|
项目最大并行度 | 项目内任务运行的最大并行数,为1~5000的整数,项目最大并行度应大于等于项目重跑最大并行度。 |
项目重跑最大并行度 | 项目重跑的任务运行最大并行数,为1~5000的整数,项目重跑最大并行度应小于等于项目最大并行度。 |
默认监控规则 | 系统提供的基础监控规则,规则内容为任务重试结束仍失败,报警以邮件形式发送给任务负责人,且仅发送1次。 若选择启用,则项目内任务上线时,会自动选中默认监控规则。 说明 - 默认监控规则由系统提供,用户不可修改。
- 任务上线时/上线后,均可选择是否使用默认监控规则。
- 若选中任务中包含Kafka2HDFS任务,默认监控规则对该类型任务不生效。
|
*数据安全设置 | 用于控制数据开发页面查询结果的查看、复制、下载权限,防止大量核心数据流出。支持统一设置和按角色设置两个选项。 |
*任务查询结果返回最大记录 | 任务查询返回结果可显示的最大记录数。可按需设置,设置范围为1~1000000的整数,默认值为1000000。 |
Select查询结果设置 | 可选择是否允许下载和复制查询结果,支持选项允许下载和允许复制,默认全选中。 - 若勾选选项,则在数据开发页面调试操作后,支持下载和复制调试结果信息。
- 若不勾选选项,则调试操作后,不支持下载和复制调试结果信息。
|
设置详情 | 按管理员、开发、复查人三个角色分别设置查询返回的最大数据行数、复制查询结果、下载的最大数据行数。 - 查询返回的最大数据行数:均默认1000,可分别编辑。
- 复制查询结果:均默认开启,可分别编辑。
- 下载的最大数据行数:均默认开启,其中管理员默认为1000000,开发和复查人均默认为100000,可分别编辑。
说明 当数据安全设置选择按角色设置时,需设置该参数。 |
消息通知设置 | 可选择在什么情况下发送通知消息,支持以下选项,可多选。 - 临时查询运行成功
- 临时查询运行失败
- 任务调试运行成功
- 任务调试运行失败
|
| |
*开启任务类型 | 可选择是否开启该项目下的任务开发类型。支持选项数据开发、数据集成和数据同步解决方案,默认全选中,可按需编辑。
勾选开启后,才可在该项目的任务开发页面新建相应类型的任务。 |
配置服务绑定信息
服务绑定信息相关参数说明如下表所示。
参数 | 说明 |
|---|
*引擎设置 | 支持绑定以下引擎,可多选。 - Apache Hadoop:设置项包括Apache Hadoop集群实例、计算队列和访问模式。
- Apache Hadoop集群实例:下拉可选已在集群管理页面注册的集群。
- 计算队列:支持绑定多个实例下对应的计算队列。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- MinBase Hadoop:设置项包括MinBase Hadoop集群实例、计算队列和访问模式。
- MinBase Hadoop集群实例:下拉可选已在集群管理页面注册的集群。
- 计算队列:支持绑定多个实例下对应的计算队列。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- ByteHouse CE:是企业的智能增长引擎,基于开源 ClickHouse 的企业级分析型数据库,支持用户交互式分析 PB 级别数据,通过多种自研表引擎,灵活支持各类数据分析和应用。设置项包括ByteHouse CE集群实例和访问模式,支持绑定多个。
- ByteHouse CE集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- Doris分析型数据库:是一个现代化的 MPP 分析型数据库产品,仅需亚秒级响应时间即可获得查询结果,可高效地进行实时数据分析。设置项包括Doris集群实例和访问模式,支持绑定多个。
- Doris集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- GBASE8A:是一款新型分析型数据库,主要用于大数据的全数据(结构化数据、半结构化数据和非结构化数据)存储管理和高效分析。设置项包括 GBASW8A集群实例和访问模式,支持绑定多个。
- GBASW8A集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- 湖仓一体分析服务:Serverless 湖仓一体分析服务,企业级标准构建湖仓分析平台。设置项包括LAS集群实例、计算队列和访问模式。
- LAS集群实例:下拉可选已在集群管理页面注册的集群。
- 计算队列:支持绑定多个实例下对应的计算队列。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- Greenplum:是MPP架构的大数据分析引擎,它基于PostgreSQL构建,具有强大的大规模数据分析任务处理能力。设置项包括Greenplum集群实例和访问模式,支持绑定多个。
- Greenplum集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- DWS:是一款关系型数据库,旨在提供高性能、高可用性和高安全性的数据库解决方案。设置项包括DWS集群实例和访问模式,支持绑定多个。
- DWS集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- STARROCKS:是一款高性能分析型数据仓库,广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。设置项包括STARROCKS集群实例和访问模式,支持绑定多个。
- STARROCKS集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- ORACLE:支持结构化查询语言(SQL),是用于管理和处理数据的标准数据库。设置项包括ORACLE集群实例和访问模式,支持绑定多个。
- ORACLE集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
- SQLSERVER:主要用于存储和管理数据,支持结构化查询语言(SQL),是一种用于管理和处理数据的标准数据库。设置项包括SQLSERVER集群实例和访问模式,支持绑定多个。
- SQLSERVER集群实例:下拉可选已在集群管理页面注册的集群。
- 访问模式:自动填充所选集群的访问模式,不可编辑。
注意 - 禁止同时绑定多个开启 Kerberos 的集群类型。若绑定了多个开启 Kerberos 认证的集群,则流式任务在使用其中某个集群执行任务时,将会导致该流式任务执行异常。
- 不支持同时绑定 Apache Hadoop 和 MinBase Hadoop 引擎。
- 当一个引擎配置两个以上集群时,即支持通过显示的删除按钮删除其中一个或者多个集群进行解绑。解绑后,该集群下的任务将无法继续执行,请谨慎操作!
|