最近更新时间:2023.09.11 11:20:14
首次发布时间:2021.02.23 10:42:01
数据连接,也可以称之为数据源接入,是完成与数据库对接的第一步,完成之后可以创建数据集作为数据可视化查询分析的输入;也可以作为数据可视化建模的输入。
智能数据洞察产品支持用户做私有化部署,或者直接使用火山引擎 SaaS 版本。对于 SaaS 版本,用户需将下列 IP 设置为白名单,180.184.64.81
、180.184.87.232
、180.184.102.141
,设置成功后即可在 SaaS 环境接入数据。
连接方式的区别直接查看抽取与直连介绍
有的数据库存在版本区分,以下列出产品支持的版本号
产品有私有化部署版本和在线的 SaaS 版本,数据源在环境支持上也存在差异,在下方表格列出
数据库的接入方法快速了解可查看快速入门,详细接入方法在下方表格列出:
数据源名称 | 支持连接方式 | 支持版本 | 支持环境 | 是否支持创建 | 接入方法 |
---|---|---|---|---|---|
Hive | 离线抽取 | 1.x | SaaS、私有化部署 | 支持 | |
ClickHouse 社区版 | 离线抽取、直连 | 19 | SaaS、私有化部署 | 支持 | |
ByteHouse CDW | 直连 | -- | SaaS、私有化部署 | 支持 | ByteHouse CDW |
ByteHouse CE | 直连 | 2.1 | SaaS、私有化部署 | 支持 | ByteHouse CE |
MySQL | 离线抽取、直连 | 5.5 | SaaS、私有化部署 | 支持 | |
Oracle | 离线抽取 | 11g Enterprise Edition Release | SaaS、私有化部署 | 支持 | |
Impala | 离线抽取、直连 | 2.12.0-cdh5.15.1 | SaaS、私有化部署 | 支持 | |
PostgreSQL | 离线抽取 | 8 | SaaS、私有化部署 | 支持 | |
SQL Server | 离线抽取 | 2012 | SaaS、私有化部署 | 支持 | |
HBase Phoenix | 离线抽取 | Phoenix 4.14 / Hbase 1.3 | SaaS、私有化部署 | 支持 | |
HBase | 离线抽取 | 1.x | SaaS、私有化部署 | 不支持 | |
ADB2.0 | 离线抽取 | -- | SaaS、私有化部署 | 支持 | |
ADB3.0 | 离线抽取 | -- | SaaS、私有化部署 | 支持 | |
IBM DB2 | 离线抽取 | 11.5.4.0 | SaaS、私有化部署 | 支持 | |
StarRocks | 离线抽取 | -- | SaaS、私有化部署 | 支持 | |
SAP HANA | 离线抽取 | 2.x | SaaS、私有化部署 | 支持 | |
REST API | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | |
MaxCompute | 离线抽取 | 1.0 | SaaS、私有化部署 | 支持 | |
Excel/CSV 文件 | 离线抽取、直连 | -- | SaaS、私有化部署 | 不支持 | |
Access | 离线抽取 | 私有化部署 | 不支持 | Access | |
飞书电子表格 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | |
飞书多维表格 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | |
Kafka | 实时抽取 | 0.8.x 版本以上 | 私有化部署 | 不支持 | |
巨量引擎/巨量千川 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | |
内容平台 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | |
Amazon Athena | 离线抽取 | -- | SaaS、私有化部署 | 支持 | |
Amazon Redshift | 离线抽取 | 8.0.2 | SaaS、私有化部署 | 支持 | Amazon Redshift |
Vertica | 离线抽取 | 7.1.1-0 | SaaS、私有化部署 | 不支持 | |
MongoDB | 离线抽取 | 4.4.4 | SaaS、私有化部署 | 支持 | |
Presto | 离线抽取、直连(V2.50.0 版本及之后支持) | SaaS、私有化部署 | 支持 | ||
Teradata | 离线抽取 | -- | SaaS、私有化部署 | 支持 | |
GreenPlum | 离线抽取 | 6.8.0 | SaaS、私有化部署 | 支持 | |
DataFinder | 直连 | -- | SaaS、私有化部署 | 不支持 | DataFinder |
LAS(公有云版) | 离线抽取 | -- | SaaS、私有化部署 | 支持 | LAS |
Doris | 直连 | SaaS、私有化部署 | 支持 | Doris | |
Databricks | 离线抽取 | SaaS、私有化部署 | 支持 | Databricks | |
Pulsar | 实时抽取 | 2.8.3 | 私有化部署 | 不支持 | |
微信公众号 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | 微信公众号 |
抖音生态数据 | 离线抽取 | -- | SaaS、私有化部署 | 不支持 | 抖音生态数据 |
星座数据 | 直连 | -- | SaaS、私有化部署 | 不支持 | 星座数据 |
日历数据 | 直连 | -- | SaaS、私有化部署 | 不支持 | 日历数据 |
(1)进入火山引擎智能数据洞察产品,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。
(2)选择要连接的数据源类型。
(3)配置对应参数,可以参考如下 MySQL 的 DEMO 库信息。
名称 | 描述 | 示例值 |
---|---|---|
数据连接名称 | 数据源配置列表的显示名称。 | Demo 数据源 |
服务器 | 填写 IP 地址。 | 10.225.34.22 |
端口 | 填写正确的端口号。 | 3306 |
数据库 | 连接数据库名称。 | DataWind_online_demo |
用户名 | 数据库对应的用户名。 | DataWind_admin |
密码 | 数据库对应密码。 | DataWind_password123 |
(4)查找已创建的数据连接
在数据连接目录(左侧列表),您可以依据自己所拥有的权限进行筛选查找。(此功能于2.54.0及以上版本支持)
将数据离线抽取到 DataWind 内置高性能存储计算引擎中,目前支持的大部分数据库都默认支持离线抽取
应用场景
覆盖数据源面广:抽取模式支持以上所有数据源类型
建模能力强:支持跨数据源多表 join、多表合并
查询性能快:支持超大数据量多维查询,内置计算引擎性能好,能够支撑满足大数据量的快速分析
使用限制
将数据实时抽取到引擎中存储,仅支持 Kafka、Pulsar 数据源等
直接连接数据库,利用数据库的性能
应用场景
使用限制
查询性能受数据库性能影响大:由于直接连接用户数据库,受数据连接和数据库引擎性能限制,查询性能可能受到影响
在 V2.50.0 版本之前仅支持单表直连查询
从 V2.50.0 版本及之后,除 finder 数据连接仅支持单表外,其他直连数据源可支持多表 Union、Join、自定义 SQL,多表不可跨数据源、跨数据连接使用,比如来自 A 数据连接的表 A 和来自 B 数据连接的表 B,不能进行union/join,或者在自定义 SQL 中同时存在表 A、B 的操作