说明
智能数据洞察是一个BI(Business Intelligence)平台,简单来说,它可以把我们的数据,以简单地拖拉拽的方式,做成一张图表,并且这些图表还可以放在一起做成一张仪表盘。
先跟大家介绍下智能数据洞察的几个主要模块以及它们之间的关系。如果能知道智能数据洞察是怎么把数据变成图表的,能够让大家更好地去理解这款产品。
智能数据洞察的整个流程可以参考下面这个图,这里主要涉及到5个概念:
概念 | 说明 |
---|---|
|
|
| |
|
|
| |
|
上面的概念主要是让大家理解智能数据洞察是干什么的,而对于大多数人来说,只需要了解可视化查询以及仪表盘就行了,因为在很多企业中,数据集一般都是大数据团队中的数仓人员帮忙创建好了,我们直接用就行~
接下来我们会从导入数据、可视化查询(这是我们最常使用的模块)到仪表盘,带领大家从零开启智能数据洞察使用攻略,带好你的小板凳!
说明
使用智能数据洞察进行查询,首先需要有数据,数据一般存储在数据源中,需要将数据源中的数据先导入至智能数据洞察作为数据集,之后才可以进行查询。
源名称 | 支持连接方式 | 支持环境 | 是否支持创建 | 接入帮助文档 |
---|---|---|---|---|
Excel/CSV 文件 | 离线抽取、直连 | SaaS、私有化部署 | 不支持 | |
Access | 离线抽取 | 私有化部署 | 不支持 | |
Kafka | 实时抽取 | 私有化部署 | 不支持 | |
Pulsar | 实时抽取 | 私有化部署 | 不支持 | |
GreenPlum | 离线抽取 | SaaS、私有化部署 | 支持 | |
SAP HANA | 离线抽取 | SaaS、私有化部署 | 支持 | |
Impala | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
ClickHouse 社区版 | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
HBase Phoenix | 离线抽取 | SaaS、私有化部署 | 支持 | |
HBase | 离线抽取 | SaaS、私有化部署 | 不支持 | |
Vertica | 离线抽取 | SaaS、私有化部署 | 不支持 | |
Amazon Athena | 离线抽取 | SaaS、私有化部署 | 支持 | |
Amazon Redshift | 离线抽取 | SaaS、私有化部署 | 支持 | |
ByteHouse CDW | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
ByteHouse CE | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
Presto | 离线抽取、直连(V2.50.0 版本及之后支持) | SaaS、私有化部署 | 支持 | |
Databricks | 离线抽取 | SaaS、私有化部署 | 支持 | |
AnalyticDB for MySQL 2.0 | 离线抽取 | SaaS、私有化部署 | 支持 | |
AnalyticDB for MySQL 3.0 | 离线抽取 | SaaS、私有化部署 | 支持 | |
Hologres | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
MySQL | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
IBM DB2 | 离线抽取 | SaaS、私有化部署 | 支持 | |
Oracle | 离线抽取 | SaaS、私有化部署 | 支持 | |
PostgreSQL | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
OpenGauss | 离线抽取 | SaaS、私有化部署 | 支持 | |
SQL Server | 离线抽取 | SaaS、私有化部署 | 支持 | |
Teradata | 离线抽取 | SaaS、私有化部署 | 支持 | |
Doris | 离线抽取、直连 | SaaS、私有化部署 | 支持 | |
达梦 | 离线抽取 | SaaS、私有化部署 | 支持 | |
TiDB | 离线抽取 | SaaS、私有化部署 | 支持 | |
GoldenDB | 离线抽取 | SaaS、私有化部署 | 支持 | |
OceanBase MySQL | 离线抽取 | SaaS、私有化部署 | 支持 | |
OceanBase Oracle | 离线抽取 | SaaS、私有化部署 | 支持 | |
Hive | 离线抽取 | SaaS、私有化部署 | 支持 | |
MaxCompute | 离线抽取 | SaaS、私有化部署 | 支持 | |
星环 Inceptor | 离线抽取 | SaaS、私有化部署 | -- | |
StarRocks | 离线抽取、直连 | SaaS、私有化部署 | 不支持 | |
华为 FusionInsight | 离线抽取 | SaaS、私有化部署 | 支持 | |
腾讯云 DLC | 离线抽取 | SaaS、私有化部署 | 支持 | |
DataFinder | 直连 | SaaS、私有化部署 | 不支持 | |
LAS(公有云版) | 离线抽取 | SaaS、私有化部署 | 支持 | |
智能外呼 | 离线抽取 | SaaS、私有化部署 | -- | |
元数据连接与应用 | -- | 私有化部署 | -- | |
抖音生态类数据 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
巨量引擎/巨量千川 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
REST API | 离线抽取 | SaaS、私有化部署 | 不支持 | |
内容平台 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
MongoDB | 离线抽取 | SaaS、私有化部署 | 支持 | |
微信公众号 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
星座数据 | 直连 | SaaS、私有化部署 | 不支持 | |
日历数据 | 直连 | SaaS、私有化部署 | 不支持 | |
飞书电子表格 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
飞书多维表格 | 离线抽取 | SaaS、私有化部署 | 不支持 | |
飞书项目(Meego)数据 | 离线抽取 | SaaS、私有化部署 | 不支持 |
具体配置可参考上方支持的数据源后的接入帮助文档。
说明
来到了对大家最重要的模块,可视化查询,也就是我们查数据的地方。
首先是可视化查询页面的整体布局,可视化页面整体分为四个区域:
A. 数据集信息和字段列表:展示我们正在查哪个数据集、这个数据集有哪些字段、在这里可以切换数据集
B. 图表和分析功能:选择图表类型、对图表进行配置、选择分析功能(排序、百分比、同环比、表计算等)
C. 图表展示区:我们要查什么,就在这里放上什么字段,这里会展示最终图表的样式和调整图表的数据格式等
D. 工具栏:查询历史、下载数据、配置图表数据监控、以及保存图表
说明
在进行查询之前,我们有一个小概念需要大家学习,也就是维度和指标的概念,维度和指标我们一般统称为字段。
大家可以看下面两张图,左边是我把智能数据洞察里一个数据集的所有字段都放在了图表中,而右侧是这个数据集的底层数据,大家会发现,其实这里的字段,对应的就是原始数据中的某一列,而且当智能数据洞察这边图表选的是普通表格的时候,查出来的数据跟原始的数据非常相似(看起来一样,其实有区别的,这个我们后面讲)。
那么我们在智能数据洞察选择哪些字段的时候,其实就相当于从这个底层数据查哪些列的数据:
然后是维度和指标的区别,这个比较简单,大家可以理解为维度是从什么粒度看数据,指标则是度量值,比如我们要看某个班级所有同学的成绩,那同学的姓名是维度,成绩是指标,维度和指标并不是固定的,有时候维度字段也会成为指标,比如我们要看每个成绩区间的人数有多少,那这时候对成绩划分的区间是维度,同学的姓名的计数就是指标。
在智能数据洞察里也是这样,即使一个字段被划分成了维度,它也是可以被放到指标栏的,指标字段也同样可以放在维度栏。
说明
接下来就是可视化查询的使用步骤了,这里我们会用假设的需求作为例子,带大家过一遍怎么使用智能数据洞察去完成一个查询数据的需求。
查询示例 1
假设我们当前的查数需求为:24年Q2季度,粉丝数大于1千,音乐这个视频一级垂类下所有二级垂类的进审量变化趋势。
| |
---|---|
Step1.首先把需要的维度跟指标放在维度跟指标栏里面,这里可以选择拖动或者点击左侧的字段 | |
Step2.然后就可以配置筛选,这里也可以把需要做筛选的字段拖到筛选栏里,然后选择合适的筛选方式 | |
Step3.最后就是选择一个合适的图表了
|
查询示例 2
假设我们当前的查数需求为:按照视频一级垂类粒度,看一下今年,视频来源为抖音的视频数量占比。
| |
---|---|
| |
| |
|
怎么区分字段类型 | 智能数据洞察的字段跟Excel表格里一样,也是会分类型的,它们可以通过字段名称前面的图标区分,例如下图中:
|
---|---|
指标上面的求和是什么意思 | 如果大家是刚接触智能数据洞察,会对这里比较疑惑,为什么字段放在指标里前面会显示「求和」,有时候也会显示「计数」还有「聚合」。 这里首先有一个叫聚合的概念,其实很好理解,一组数据经过计算得到一个数据,那这个计算的过程就叫聚合。
因为大家平时看数据,看明细数据的场景还是比较少的,所以智能数据洞察这边,除了明细表以外的其他图表,都会自动对大家放上去的指标,按照你的维度来做聚合。
当然,大家可能平时不止看求和的数据,所以这里是可以点击指标前面的倒三角,来选择聚合的方式的,比如要看数量,那就选计数;要看平均值,那就选平均。
|
p_date 是什么筛选 | 细心的同学可能会发现,智能数据洞察可视化查询的筛选栏,总是会自动有一个筛选叫 p_date,而且这个筛选它没法从筛选里去掉,也就是必须得筛。
|
说明
完成查询后,我们可以选择把当前的图表保存下来、把数据下载下来、又或者是可以把我们当前的查询结果分享给其他同学。
保存图表
| |
---|---|
下载数据
| |
分享查询
|
说明
这里是一些图表常用的配置项,可以点击蓝色文字可以跳转到详细的帮助文档。
配置 | 说明 |
---|---|
改数据格式
| |
改日期粒度
| |
改表头名称
| |
快捷排序
| |
在图表上展示数据
|
说明
这里我们主要介绍一些可视化查询页面的进阶功能,它们不一定是必须的,只是大家如果有类似的场景,这些功能可以为大家提供帮助~
配置 | 说明 |
---|---|
| |
| |
|
配置 | 说明 |
---|---|
将筛选器放在图表上
| |
| |
|
排序、百分比、同环比、表计算、对比等
|
---|
检测图表中的数据并作出报警
|
---|
说明
本章内容就要给大家介绍智能数据洞察的仪表盘了,我们在前面学习了如何去使用可视化查询数据,制作出来的图表我们是可以保存的,那么这些图表会需要有一个地方来统一展示它们——就是仪表盘。它相当于一张空白的画布,可以在上面布置图表、文本、图片之类的组件。关于仪表盘的搭建技巧与流程,也可以查看视频课程:《让数据讲故事:仪表盘搭建指南》。
说明
由于创建仪表盘相当于在项目下新增了资源,所以需要项目的编辑权限,但是有些同学可能只是创建仪表盘自己看,不想去打扰其他人申请权限,因此智能数据洞察提供了个人仪表盘与公共仪表盘两种,不过需要注意:
个人仪表盘最多给其他人授权查看权限,如果想要有其他同学一起来编辑维护这个仪表盘,则需要创建公共仪表盘。
个人仪表盘 | 公共仪表盘 | |
---|---|---|
创建所需权限 | 项目查看权限 | 项目编辑权限 |
可以给他人授予的最高权限 | 查看权限 | 管理权限 |
至于怎么选择创建个人还是公共仪表盘,在创建的时候会让我们选择仪表盘保存的路径,如果选择个人仪表盘,那创建出来的就是个人仪表盘,反之就是公共仪表盘。
说明
创建完空白仪表盘之后,咱们就可以来编辑这个仪表盘了,编辑仪表盘其实也很简单,不知道大家有没有做过PPT,其实跟在PPT上加东西是一样的。
| |
---|---|
|
(1)直接点击左侧的「添加图表」,或者直接鼠标点住然后拖到中间画布,就会在画布上添加一个图表组件 | |
---|---|
(2)有了图表组件后,可以为这个组件配置对应的图表,这里有两种方式 |
|
(3)在仪表盘上添加完图表之后,如果有需要让仪表盘加一些说明或者结构更清晰,也可以加一些其他组件,比如标题、图片、说明等 | |
(4)当制作好仪表盘后,点击右上角的保存就可以了 |
添加Sheet页
| |
---|---|
| |
| |
|
仪表盘除了可以用来统一看图表数据以外,也有一些其他的用法:
复制仪表盘或者图表
|
|
---|---|
配置仪表盘的订阅推送
| |
把仪表盘的图表嵌出
|
仪表盘 |
|
---|---|
数据集 |
项目中心-权限申请 |
---|
说明
在大家使用的过程中,很可能会遇到各类的问题,由于智能数据洞察主要是作为查询数据、洞察业务的平台,可以查询的数据可能是企业中的业务团队自己维护的。所以大家遇到的问题有些是功能的使用问题,也有一些是业务问题。在遇到问题时,如何正确寻求帮助来有效提高效率?
智能数据洞察产品使用问题
|
|
---|---|
业务问题
| 如果是在看仪表盘的时候遇到此类问题,可以咨询仪表盘的所有者 |