You need to enable JavaScript to run this app.
导航
StarRocks
最近更新时间:2025.09.08 14:57:23首次发布时间:2022.03.31 18:28:26
复制全文
我的收藏
有用
有用
无用
无用

本文为您介绍如何接入 StarRocks 来创建数据集。

前提条件

在连接数据之前,请收集以下信息:

  • 数据库所在服务器的 IP 地址和端口号
  • 数据库的用户名和密码

从数据连接新建
  1. 进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。

  2. 在页面中选择 StarRocks。
    Image

  3. 填写所需的基本信息,并进行测试连接,连接成功后点击保存。

    • SaaS 版本相关参数配置说明如下:
      Image

      参数

      配置说明

      数据连接名称

      新建数据连接的名称,用于在系统中区分不同数据库的连接。默认为StarRocks_时间戳。可对名称进行修改,但请输入规范的名称,只允许中文、英文、数字和下划线的组合,前后不能包含空格。

      服务器

      StarRocks 的公共网络地址,获取请参考 StarRocks 官网文档

      端口

      StarRocks 的实例端口,获取请参考 StarRocks 官网文档

      用户名

      数据库引擎中创建的用户名,若您不知道如何获取,建议联系联系对应引擎的运维人员获取。

      密码

      数据库引擎中创建的密码,若您不知道如何获取,建议联系对应引擎的运维人员获取。

      连接方式

      Saas版本提供 IP/Port 连接方式。
      Image

      externalCatalog

      需要通过外部目录查询外部数据源(Hive、Iceberg、Hudi、Delta Lake、JDBC、Elasticsearch、Paimon 等)时必须填写,填写内容为 “catalog 名称.库名”里的库名。(例如:my_catalog.hive_db1,此处填写 hive_db1)

      权限模式

      支持读和写两种方式。

      • 读:仅获取数据源中的数据,不能修改、添加或删除数据。
      • 写:用户需要通过可视化建模向数据连接中写入数据,需具备数据的操作权限。

      vpcMode 和 VPC ID

      • vpcMode:如果用户需要通过火山云内网连接,选「是」;其余情况选「否」。

        注意

        VPC 内网连接目前仅支持华北地区。

      • VPC ID:当vpcMode为「是」时需填写,获取方式见准备工作
    • 私有化版本相关参数配置说明如下:
      Image

      参数

      配置说明

      数据连接名称

      新建数据连接的名称,用于在系统中区分不同数据库的连接。默认为StarRocks_时间戳。可对名称进行修改,但请输入规范的名称,只允许中文、英文、数字和下划线的组合,前后不能包含空格。

      服务器

      StarRocks 的公共网络地址,获取请参考 StarRocks 官网文档

      端口

      StarRocks 的实例端口,获取请参考 StarRocks 官网文档

      用户名

      数据库引擎中创建的用户名,若您不知道如何获取,建议联系联系对应引擎的运维人员获取。

      密码

      数据库引擎中创建的密码,若您不知道如何获取,建议联系对应引擎的运维人员获取。

      连接方式

      私有化版本提供 IP/Port 和 JDBC连接字符串连接两种方式。

      • IP/Port:适用于一般情况。
        Image
      • JDBC 字符串连接:适用于用户需要添加连接参数的场景。
        Image

      externalCatalog

      需要通过外部目录查询外部数据源(Hive、Iceberg、Hudi、Delta Lake、JDBC、Elasticsearch、Paimon 等)时必须填写,填写内容为 “catalog 名称.库名”里的库名。(例如:my_catalog.hive_db1,此处填写 hive_db1)

      JDBC连接字符串

      JDBC 连接串,获取方式请参考 StarRocks 官网文档

      权限模式

      支持读和写两种方式。

      • 读:仅获取数据源中的数据,不能修改、添加或删除数据。
      • 写:用户需要通过可视化建模向数据连接中写入数据,需具备数据的操作权限。

从数据集新建
  1. 进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。
    Image
  2. 选择数据连接的时候,点击新建配置。
    Image
  3. 后续步骤与上述从数据连接新建的2、3步一致,在完成配置之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。

后续步骤:创建数据集
  1. 使用之前创建好的数据连接创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。
    Image
  2. 搜索或下拉选择之前新建好的数据连接。
    Image