数据连接支持接入火山云 TOS。
下面介绍两种方式创建火山云TOS数据连接。
(1)进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,新建数据连接。
(2)在页面中选择火山云TOS。
(3)填写所需的基本信息,并进行测试连接,连接成功后点击保存。
数据连接参数说明:
(4)确认数据连接的基本信息无误后即完成数据连接。
(5)可使用该连接创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。
(6)输入关键词搜索,选择之前新建好的数据连接。
(1)进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。
(2)选择数据连接的时候,点击其他按钮。
之后的步骤与上述 2.1 的(2)、(3)步一致,在完成配置之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。
表名:student_np
student_np // 表名对应的目录 ├── student.txt // 数据文件,类型在数据连接中指定,会读取到文件夹下所有该类型的数据文件 ├── student2.txt └── student_np.yml // schema文件,名字需要和表名一致
示例Schema内容:
#请按以下参数填写: ### name: 字段名称(必填) ########## 字段命名规则:需确保字段名唯一性;仅支持字母、数字、下划线且以字母为首,最多100个字符 ### alias: 字段别名(选填) ########## 字段别名规则:字符类型不限,最多100个字符 ### type: 字段类型(必填) ########## 类型规则:无需明确长度,可指定类型如下: # string # boolean # long # double # date # datetime # 下面两种类型中的%s仅支持基本类型如int # 不支持多层嵌套,例如array<array<int>> # array<%s> # map<%s,%s> #-------------------------------------------------------------------------------- columns: - name: brand_id alias: 品牌id typ: int - name: brand_name alias: 品牌名称 type: string - name: brand_desc alias: 品牌介绍 type: string - name: create_time alias: 创建时间 type: date - name: update_time alias: 变更时间 type: date
表名:student_p1
student_p1 // 表名对应的目录 ├── 20240909 // 分区 │ ├── _SUCCESS // 成功标志文件 │ ├── student.csv // 数据文件,类型在数据连接中指定,会读取到文件夹下所有该类型的数据文件 │ ├── student2.csv │ └── student3.csv ├── 20240910 │ ├── _SUCCESS │ ├── student.csv │ ├── student2.csv │ └── student3.csv └── student_p1.yml // schema文件,名字需要和表名一致