You need to enable JavaScript to run this app.
导航
Amazon Athena
最近更新时间:2023.05.24 16:52:23首次发布时间:2022.07.12 09:42:40
1. 概述

从 V2.44.0 版本及之后,支持接入 Amazon Athena 创建数据集。

2 快速入门

下面介绍两种方式创建数据连接。

2.1 从数据连接新建

(1)进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。

(2)在页面中选择 Amazon Athena。

(3)填写所需的基本信息,并进行测试连接,连接成功后点击保存。


(4)确认数据连接的基本信息无误后即完成数据连接。

(5)可使用该连接作为数据源去创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。


(6)搜索或下拉已有连接,选择之前新建好的数据源。

2.2 从数据集新建

(1)进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。


(2)选择数据连接的时候,点击新建配置。

之后的步骤与上述 2.1 的(2)、(3)步一致,在完成上传之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。

3. 功能介绍

3.1 AK 和 SK

数据连接的基础信息中的访问密钥 ID(Access Key ID)和访问密钥(Secret Access Key)是Amazon 的 AK 和SK 信息:

  • 可以登陆 Amazon,之后点击头像下的「我的安全凭证

  • 点击 Amazon IAM 凭证,找到【访问密钥 ID】(任选其一),以及生成该 ID 时对应 SK(生成 AK 时候产生的自行保存的信息)

  • 在访问密钥 ID(Access Key ID)上填写【访问密钥 ID】,在访问密钥(Secret Access Key)上填写【该 ID 对应 SK】即可

3.2 区域(Region)

使用上述账户点击进入要对接的 S3,在 URL 上即可获得该数据源的 Region 信息,比如 https://console.amazonaws.cn/s3/buckets?region=cn-north-1,其 Region 就是 cn-north-1

即可将该 Region 信息填写到数据连接信息中

3.3 S3 暂存目录(S3OutputLocation)

  • 由于 Athena 是一个 SQL 引擎,因此对于中间计算结果需要存储下来,因此需要这个空间

  • 用户可以在自己的 S3 上定义的位置,注意当前的使用账号需要有该目录的读写权限即可