You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
导航

创建数据集

最近更新时间2023.07.28 10:50:50

首次发布时间2022.07.26 11:41:18

数据服务通过采集数据集中的数据源信息,获取数据库表的Schema信息,并可以执行后续的数据查询请求。本文将为您介绍创建数据集的操作。

1 使用前提

  1. 需配置数据源信息,Doris 数据源配置操作详见:数据源配置

  2. 需MySQL实例开通公网连接并将数据服务公网地址:180.184.102.216 添加至数据库实例白名单。

2 进入数据服务

  1. 登录 DataLeap租户控制台

  2. 概览 界面顶部服务窗口,点击 数据服务 ,可快速进入到 数据服务 功能界面。

3 创建数据集

进入 数据服务 功能界面后,在右上角的项目下拉框中,选择要对应的项目,会展现当前项目下 数据集 目录信息。

3.1 新建数据集目录文件夹

  1. 在数据集目录导航栏,点击 “+”---新建数据集目录文件夹 按钮,填写以下参数信息新建数据目录:
参数说明
目录名称输入数据集目录名称。
负责人下拉选择当前数据集目录负责人。
分享范围默认选择项目内分享,只允许项目内成员看到该数据集。
用途描述输入该数据集用途描述,方便后续数据目录管理。
  1. 点击 确认 按钮,数据集目录即创建完成。

  2. 点击数据集文件夹名称右侧的 更多 选项,您可以 编辑、删除 该数据集目录文件夹。

  3. 在左侧导航栏下方,您可以打开/关闭 “我的数据集目录” 按钮,来筛选是否只显示您创建的数据集目录。

  4. 我的数据集目录 按钮右侧的折叠按钮,您可以选择是否折叠 数据集目录 导航栏。

3.2 添加数据集

  1. 数据集目录文件夹创建完成后,右上角点击 +添加数据集 按钮,进入新增数据集界面。

注意

  1. 首次添加数据集时,需要选定数据集对应的数据源,目前支持选择火山引擎云数据库 MySQL 版、ByteHouse、EMR-Doris 数据源。
  2. 数据源配置 中MySQL数据源测试连通成功后,MySQL实例需再开通公网连接并将数据服务公网地址:180.184.102.216 添加至数据库实例白名单中。
  1. 在待选库表的输入框中,输入MySQL库名关键字,进行搜索。

  2. 点击对应库名展开,获取当前库下所有的表,勾选表名,将表导入到当前数据集中。

  3. 点击 提交 按钮,新增数据集成功。
    alt

  4. 提交成功后,回到数据集列表界面,展现出提交成功的数据集列表。

3.3 数据集列表参数说明

数据集列表展现出数据集名称、负责人、数据库表名称等信息,示例如下:
alt

参数描述
数据集数据集名称,默认为:数据源名称_源表名称。
负责人创建该数据集的负责人名称信息。
源表名称展现源表的表名称信息。
数据库展现数据库的库名信息。
类型物理数据集。
最近更新时间数据集最近的更新时间记录。

操作

  1. 编辑:编辑数据集,进入后您可以查看字段名称、数据类型等操作,详见:编辑数据集
  2. 查看原生API:查看是否有原生的Query查询,详见:如何添加原生Query
  3. 删除:删除当前数据集。
    注意:
    删除数据集时,需保证线上已没有API引用该数据集,可能被当前租户的API使用, 也可能是在API集市上被其他租户申请的API使用,您需要去除引用后,方可继续删除。