本文为您介绍如何接入 ByteHouse CE 来创建数据集,以进行 BI 分析和报表展示。
前提条件
用户需要有 ByteHouse CE 企业版 账号。
准备工作
- 参考 ByteHouse企业版快速入门,完成购买开通、创建集群、创建库表及数据导入的操作。
- (仅限Saas版本)用户需将“DataWind 访问的公网 IP” 填入白名单设置区域,方可在Saas环境接入数据。”DataWind 访问的公网 IP”可查看数据连接概述。具体步骤可参见 ByteHouse CE 白名单管理。
- 获取服务器。进入「集群管理」-「集群列表」页面,在网络信息栏获取服务器域名。

- 获取端口。可参考 ByteHouse CE 集群连接信息。
- 获取用户名和密码。点击「账号管理」,可查看用户名和连接密码。

- (仅限Saas版本)获取 VPC ID。点击「集群管理」-「集群列表」,在「网络信息」栏获取 VPC ID。

从数据连接新建
- 进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。

- 在页面中选择 ByteHouse CE 。

- 填写所需的基本信息,并进行测试连接,连接成功后点击保存。

相关参数配置说明如下:
参数 | 配置说明 |
|---|
数据连接名称 | 新建数据连接的名称,用于在系统中区分不同数据库的连接。默认为Bytehouse_CE_时间戳。可对名称进行修改,但请输入规范的名称,只允许中文、英文、数字和下划线的组合,前后不能包含空格。 |
服务器 | 数据连接ip或域名,若使用VPC模式: - VPC模式:仅支持填写私网IP,不支持域名。私网IP获取方式:推荐通过ping局域网域名或通过数据源控制台获取;
- 非VPC模式:可使用域名。
|
端口 | 默认:8123. |
用户名 | 获取方式见准备工作。 |
密码 | 获取方式见准备工作。 |
权限模式 | 支持读和写两种方式。 - 读:仅获取数据源中的数据,不能修改、添加或删除数据。
- 写:用户需要通过可视化建模向数据连接中写入数据,需具备数据的操作权限。
|
vpcMode 和 VPC ID | 是否使用 VPC 模式(私网模式)。仅 SaaS 版本需要填写这两项参数。

使用场景说明如下: - 启用 VPC 模式:如果您的数据源为火山引擎数据库、数据仓库类产品,推荐使用VPC模式,需将 vpcMode 设置为是,并填写 VPC ID,VPC ID 获取方式见准备工作。
注意 火山引擎产品推荐使用 VPC 模式,确保数据安全,同时也可避免额外数据传输费用。 - 禁用 VPC 模式:如果您的数据源已开启公网访问,则无需设置 vpcMode,可设置为否。
|
从数据集新建
- 进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。

- 选择数据连接的时候,点击新建配置。

- 后续步骤与上述从数据连接新建的2、3步一致,在完成配置之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。
后续步骤:创建数据集
- 使用之前创建好的数据连接创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。

- 搜索或下拉选择之前新建好的数据连接。

常见问题
实名认证
如未进行实名认证,则无法正常访问火山引擎 ByteHouse 企业版控制台,需要完成实名认证。

获取数据库局域网 IP 与 VPC ID
说明
如果您购买的是SaaS版本,需要通过VPC模式使用局域网IP连接,并且连接的数据源地区为华北2时,才需要关注获取数据库局域网 IP 与 VPC ID。
获取数据库局域网 IP
获取数据库局域网 IP 有两种方法,方法一是通过 ping 局域网域名查询,方法二是通过 VPC 下的网卡管理查询,下文将为您详细介绍。
通过 ping 局域网域名查询
- 打开命令行工具:在 Windows 系统中,按下
Windows+R键,输入cmd并回车,打开命令提示符窗口;在 macOS 或 Linux 系统中,打开终端应用程序。 - ping 局域网域名:输入
ping [数据库局域网域名],例如ping mysql-server.local,按下回车键。命令执行后,会显示域名对应的 IP 地址,这个 IP 地址就是数据库服务器在局域网中的 IP 地址。
通过 VPC 的网卡管理查询
以 MySQL 为例说明,其他产品如 PostgreSQL、负载均衡、ECS 等环境搭建的数据库同理。
进入 MySQL 的实例列表界面,点击查看“实例信息”。
进入网卡界面,在私网 IP 地址一栏中,可以查看到局域网 IP。
获取VPC ID
用户只能通过 VPC 的网卡管理查询 VPC ID。
以 MySQL 为例说明,其他产品如 PostgreSQL、负载均衡、ECS 等环境搭建的数据库同理。
进入 MySQL 的实例列表界面,点击查看“实例信息”。
将下图所示的“基本信息”中的「ID」复制,即可获得 VPC ID。
填写服务器 IP 和 VPC ID
进入数据连接配置界面,将复制的「ID」填写到A「VPC ID」一栏。
复制局域网 IP,并将此 IP 填写到数据连接界面中 B「服务器」一栏。