You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
导航

数据连接概述

最近更新时间2023.09.11 11:20:14

首次发布时间2021.02.23 10:42:01

1. 概述

数据连接,也可以称之为数据源接入,是完成与数据库对接的第一步,完成之后可以创建数据集作为数据可视化查询分析的输入;也可以作为数据可视化建模的输入。

智能数据洞察产品支持用户做私有化部署,或者直接使用火山引擎 SaaS 版本。对于 SaaS 版本,用户需将下列 IP 设置为白名单,180.184.64.81180.184.87.232180.184.102.141,设置成功后即可在 SaaS 环境接入数据。

2. 支持数据源清单
  • 连接方式的区别直接查看抽取与直连介绍

  • 有的数据库存在版本区分,以下列出产品支持的版本号

  • 产品有私有化部署版本和在线的 SaaS 版本,数据源在环境支持上也存在差异,在下方表格列出

  • 数据库的接入方法快速了解可查看快速入门,详细接入方法在下方表格列出:

数据源名称

支持连接方式

支持版本

支持环境

是否支持创建
自定义 SQL 数据集

接入方法

Hive

离线抽取

1.x
2.x
3.x
2.1.1-cdh6.3.2

SaaS、私有化部署

支持

Hive

ClickHouse 社区版

离线抽取、直连

19
20
21
22

SaaS、私有化部署

支持

ClickHouse

ByteHouse CDW直连--SaaS、私有化部署支持ByteHouse CDW
ByteHouse CE直连2.1SaaS、私有化部署支持ByteHouse CE

MySQL

离线抽取、直连

5.5
5.6
5.7
8.0

SaaS、私有化部署

支持

MySQL

Oracle

离线抽取

11g Enterprise Edition Release
11.2.0.1.0
12
18
19

SaaS、私有化部署

支持

Oracle

Impala

离线抽取、直连

2.12.0-cdh5.15.1
3.x
4.x

SaaS、私有化部署

支持

Impala

PostgreSQL

离线抽取

8
9
10
11
12
13
14
15

SaaS、私有化部署

支持

PostgreSQL

SQL Server

离线抽取

2012
2014
2016
2017
2019

SaaS、私有化部署

支持

SQL Server

HBase Phoenix

离线抽取

Phoenix 4.14 / Hbase 1.3

SaaS、私有化部署

支持

HBase Phoenix

HBase

离线抽取

1.x
2.x

SaaS、私有化部署

不支持

ADB2.0

离线抽取

--

SaaS、私有化部署

支持

ADB3.0

离线抽取

--

SaaS、私有化部署

支持

IBM DB2

离线抽取

11.5.4.0

SaaS、私有化部署

支持

IBM DB2

StarRocks

离线抽取

--

SaaS、私有化部署

支持

StarRocks

SAP HANA

离线抽取

2.x

SaaS、私有化部署

支持

SAP HANA

REST API

离线抽取

--

SaaS、私有化部署

不支持

API 数据连接

MaxCompute

离线抽取

1.0
2.0

SaaS、私有化部署

支持

MaxCompute

Excel/CSV 文件

离线抽取、直连

--

SaaS、私有化部署

不支持

本地 Excel/CSV

Access离线抽取私有化部署不支持Access

飞书电子表格

离线抽取

--

SaaS、私有化部署

不支持

飞书表格

飞书多维表格

离线抽取

--

SaaS、私有化部署

不支持

飞书多维表格

Kafka

实时抽取

0.8.x 版本以上

私有化部署

不支持

Kafka 数据接入

巨量引擎/巨量千川

离线抽取

--

SaaS、私有化部署

不支持

巨量引擎/巨量千川

内容平台

离线抽取

--

SaaS、私有化部署

不支持

内容管理平台

Amazon Athena

离线抽取

--

SaaS、私有化部署

支持

Amazon Athena

Amazon Redshift离线抽取8.0.2SaaS、私有化部署支持Amazon Redshift

Vertica

离线抽取

7.1.1-0

SaaS、私有化部署

不支持

Vertica

MongoDB

离线抽取

4.4.4
5.0.9

SaaS、私有化部署

支持

MongoDB

Presto

离线抽取、直连(V2.50.0 版本及之后支持)

SaaS、私有化部署

支持

Presto

Teradata

离线抽取

--

SaaS、私有化部署

支持

GreenPlum

离线抽取

6.8.0

SaaS、私有化部署

支持

GreenPlum

DataFinder直连--SaaS、私有化部署不支持DataFinder
LAS(公有云版)离线抽取--SaaS、私有化部署支持LAS
Doris直连SaaS、私有化部署支持Doris
Databricks离线抽取SaaS、私有化部署支持Databricks

Pulsar

实时抽取

2.8.3
2.10.1

私有化部署

不支持

Pulsar

微信公众号离线抽取--SaaS、私有化部署不支持微信公众号
抖音生态数据离线抽取--SaaS、私有化部署不支持抖音生态数据
星座数据直连--SaaS、私有化部署不支持星座数据
日历数据直连--SaaS、私有化部署不支持日历数据
3. 快速入门

(1)进入火山引擎智能数据洞察产品,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。

(2)选择要连接的数据源类型。

(3)配置对应参数,可以参考如下 MySQL 的 DEMO 库信息。

名称描述示例值
数据连接名称数据源配置列表的显示名称。Demo 数据源
服务器填写 IP 地址。10.225.34.22
端口填写正确的端口号。3306
数据库连接数据库名称。DataWind_online_demo
用户名数据库对应的用户名。DataWind_admin
密码数据库对应密码。DataWind_password123
  • 单击连接测试,进行数据源连通性测试。

  • 测试成功后,确定保存即可。

(4)查找已创建的数据连接
在数据连接目录(左侧列表),您可以依据自己所拥有的权限进行筛选查找。(此功能于2.54.0及以上版本支持)

4. 抽取与直连

4.1 离线抽取

将数据离线抽取到 DataWind 内置高性能存储计算引擎中,目前支持的大部分数据库都默认支持离线抽取

应用场景

  • 覆盖数据源面广:抽取模式支持以上所有数据源类型

  • 建模能力强:支持跨数据源多表 join、多表合并

  • 查询性能快:支持超大数据量多维查询,内置计算引擎性能好,能够支撑满足大数据量的快速分析

使用限制

  • 数据缺乏实时性:需要设置同步周期,数据会在用户选定的同步节点内进行同步

4.2 实时抽取

将数据实时抽取到引擎中存储,仅支持 Kafka、Pulsar 数据源等

4.3 直连

直接连接数据库,利用数据库的性能
应用场景

  • 支持实时数据功能,可以直接连接用户的数据库,不需要数据更新,满足用户对数据实时性的要求

使用限制

  • 查询性能受数据库性能影响大:由于直接连接用户数据库,受数据连接和数据库引擎性能限制,查询性能可能受到影响

  • 在 V2.50.0 版本之前仅支持单表直连查询

  • 从 V2.50.0 版本及之后,除 finder 数据连接仅支持单表外,其他直连数据源可支持多表 Union、Join、自定义 SQL,多表不可跨数据源、跨数据连接使用,比如来自 A 数据连接的表 A 和来自 B 数据连接的表 B,不能进行union/join,或者在自定义 SQL 中同时存在表 A、B 的操作