You need to enable JavaScript to run this app.
导航

快速开始

最近更新时间2023.11.09 11:02:11

首次发布时间2021.10.22 10:06:12

本文将带您了解 ByteHouse(云数仓版)的开通方式和基本使用,包括基本的数据分析流程如数据库/表创建、数据加载及 SQL 查询操作等。此外,本文也将介绍 ByteHouse(云数仓版)的主要功能与模块。

1. 注册账号并开通服务

  1. 请访问 火山引擎官网 登录或注册火山引擎账号。

    注意

    开通 ByteHouse(云数仓版)需要完成个人实名认证

  2. 验证手机号并完成实名认证后,您可以在官网的控制台入口进入产品控制台
  3. 在开通页面,勾选产品服务专用条款后,单击开通并等待约 1 分钟即可开通服务。
    图片

2. 在 ByteHouse 中创建数据对象

加载数据之前,首先需创建数据库和数据表。

2.1 创建数据库

  • 在数据库页签下,单击新建数据库按钮,在弹窗中创建名为 bh_demo 的数据库:
    图片
  • 您也可以使用 SQL 工作表中的 CREATE DATABASE 命令来创建数据库,SQL 语句如下所示:
    create database bh_demo;
    

2.2 创建数据表

  1. 在数据库 bh_demo 的详情页中,单击右上角【+数据表】按钮,选择 SQL 或可视化页面创建。
    图片

  2. 使用如下 SQL 语句创建名为 employment 的数据表。

    CREATE TABLE `bh_demo`.`employment`
    (
       `first_name` Nullable(String),
       `last_name` String,
       `email` String,
       `address` String,
       `city` String,
       `start_date` String
    )
    ENGINE = CnchMergeTree
    ORDER BY (city);
    

    图片

  3. 创建完成后,根据数据库详情页的指引,单击【开始导入数据】进入数据导入环节。

3. 数据导入

  1. 下载样例数据文件 employees.csv
  2. 根据建表完成的指引,进入新建数据导入任务页面。
  3. 将数据导入任务命名为dataloading,并选择【文件上传】并上传上一步下载到本地的文件。
    图片
  4. 可以看到,ByteHouse 根据源数据的格式自动进行了 table schema 解析,并和目标数据表做了匹配,校验正确性后,单击右下角的【创建】即可完成创建。
    图片
  5. 任务创建完成后,在弹出的提示框中单击【确定】来启动导入作业,约 5s 完成导入。
    图片

说明

除文件上传外,ByteHouse 也提供多种数据源导入数据,详情参考数据导入简介

4. 数据查询

  1. 进入 SQL 工作表 页签,单击选择对应角色和正在运行的计算组。图片

  2. 在查询 SQL 编辑区中执行以下 SQL 语句。

    • 查询数据条数
    select count(*) from bh_demo.employment;
    
    • 插入更多测试数据
    insert into bh_demo.employment values
    ('Clementine','Adamou','cadamou@bytedance.com','10510 Sachs Road','Klenak','2017-9-22'),
    ('Marlowe','De Anesy','madamouc@bytedance.co.uk','36768 Northfield Plaza','Fangshan','2017-1-26');
    
    • 根据电子邮件地址查询数据
    select email from bh_demo.employment where email like '%.uk';
    

    最后,可以切换到 查询历史 页签中查看历史记录,并对查询进行分析,如下所示:
    图片

5 进一步使用

以上就是 ByteHouse 快速入门指南,更多文章和最佳实践参考如下:
样本数据导入
ByteHouse 建表配置实践
ByteHouse Unique 唯一表最佳实践