You need to enable JavaScript to run this app.
导航
产品名词解释
最近更新时间:2024.07.01 21:09:38首次发布时间:2021.02.23 10:42:03

1. 数据集

名词

说明

数据集

数据集是由一张或多张表组成的数据模型,是可视化查询、图表、看板的基础,在使用这三个模块前,需要在“数据集”模块建立数据连接,将数据接入 DataWind。

数据类型

数据类型是为了把数据分成所需内存大小不同的数据,需要用大数据的时候才需要申请大内存。这样,能够充分合理地利用内存。

表达式

可通过sql编辑表达式,获取想要的数据。如你在原表中有一个时间戳字段 creat_time:1522920936,实际上你需要一个月份字段,则可以利用函数截取一个新字段 creat_month:2019-08,函数为 toMonth(toDateTime(create_time))

数据生命周期

数据生命周期可根据日期定期清理无用数据,释放公共资源。

同步类型

将指定数据库的数据定期搬运到 DataWind 数据库中。
定时:上游数据库的数据产出,根据指定的时间开始同步。
暂停:首次同步完成后不再同步。

主键

数据集设置主键后查询会更快。一般选择每次查询都会指定的过滤字段作为主键。主键可以有多个,第 1 个主键字段作用最大,其余依次递减。

分区

数据集使用分区来水平分散压力,将数据从物理上移到距离使用最频繁的用户最近的地方。

分片

数据集使用分片字段,以确保数据均匀的分布在各节点下。分片能够提升查询速度。

抽样字段

查询数据集时,抽样查询少量数据能提升查询速度。默认根据抽样字段进行 HASH。

抽样占比

可视化查询时依照抽样字段进行抽样,占比越小,数据量越小,可视化查询速度越快。

2. 可视化建模

名词

说明

数据建模

按照某种数据处理逻辑将元数据数据清洗、加工及生产的过程叫做数据建模。

数据连接

构建与各类数据源打通的配置能力,实现数据读取的首要功能。

画布

将各功能模块按照有向流程组建成一种数据加工流程的可视化效果。

算子

画布中数据读取、加工、算法、数据输出能力的集成能力,对应画布中每个方块。

连线

算子间的有向关系,指代两个算子间数据流转的通道。

数据集

参考数据集说明, 是数据准备的基础建模工具,提供基础的多表关联的数据建模能力,同时也是可被产品使用的数据容器,包含ClickHouse数据集/Hive数据集。

实时任务

数据源数据是实时更新且数据流实时加工的可视化建模任务。

离线任务

数据源数据是天级/小时级等更新(即每天/每小时更新一次)且数据流程加工过程是定时执行或手动执行的可视化建模任务。

3. 仪表盘

名词

说明

标签页

标签页为多个页面的集合,可以为不同页面显示不同标题。

公共筛选器

可以同时作用多张图表的筛选器;筛选器用于缩小图表中显示的数据选择范围。

图层顺序

不同元素重合时,将按照图层顺序进行显示。

组合

将不同元素视为一个整体,可以同时进行设置和调整移动位置。

Markdown

Markdown 是一种纯文本格式的标记语言。能够通过简单的标记语法,使普通文本内容具有特定格式。

撤销

回到最近一次操作前的状态。

重做

取消撤销。

左对齐

2 个及以上元素靠左边对齐。

垂直居中对齐

2 个及以上元素在垂直方向上的中心线对齐。

右对齐

2 个及以上元素靠右边对齐。

顶部对齐

2 个及以上元素靠上边对齐。

水平居中对齐

2 个及以上元素在水平方向上的中心线对齐。

底部对齐

2 个及以上元素靠下边对齐。

水平均匀分布

2 个及以上元素在水平方向上中心点均匀分布。

垂直均匀分布

2 个及以上元素在垂直方向上中心点均匀分布。

等间距线

在改变元素位置或改变元素大小时 ,移动元素和对照元素间距相等或出现相同高宽时出现的提示线。

参考线

在改变元素位置或改变元素大小时 ,辅助布局出现的位置提示线。

缩放

缩小或放大页面。

页面设置

可选择常用的页面尺寸,或自定义页面宽高。

外观设置

可设置页面背景色,也可以在页面添加网格线。

图表设置

可设置图表标题是否隐藏、图表标题格式;对表格可以进行显示设置,选择标准或者自适应表的高宽。

变化设置

可对元素的位置XY坐标设置,也可对元素的面积宽高进行设置。

添加描述

对图表添加解释说明。

4. 可视化查询

名词

说明

表格

表格是数据的基础展示形式,通过简单地配置维度和指标,即可展示出对应的明细数据。同时表格还支持样式配置、条件格式、列排序和固定列等操作。

透视表

透视表将数据按照列维度、行维度进行汇总计算和展现。通过简单地配置列维度、行维度和指标,即可展示出透视表。

明细表

明细表是一种展示明细数据的表格。

柱状图

柱状图通常用来描述数据在一段时间内、不同地区间的变化。

条形图

条形图可以看作是横向的柱状图,通常用来表示数据在不同时间或者不同条件下的变化。

折线图

折线图一般用来查看数据的变化趋势。

面积图

面积图与折线图相近,区别在于面积图会在折线与X轴间填充颜色。适合于描述数据的变化趋势,和部分数据对整体的贡献。

双轴图

双轴图是指有 2 个 Y 轴的数据图表,多为柱状图+折线图的结合,图表显示更为直观。适用于分析两个相差较大的数据、不同数据走势、数据同环比分析等场景。

饼图

饼图中,每个扇区圆心角大小由所代表的数量占整体的比例决定,常用来展示部分数据的数量占整体的比例。

地图

地图功能支持展示数量在不同地域的差异。

双向条形图

双向条形图,使用正向和反向的柱子显示类别之间的数值比较。

组合图

组合图通常用来对比展示同一维度的多个指标及变化情况。

散点图

散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

词云

词云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据;每个词的重要性以字体大小显示。

直方图

直方图,形状类似柱状图却有着与柱状图完全不同的含义。直方图牵涉统计学的概念,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。

指标卡

指标卡可用于直观展示某一指标值及其相关指标或变化趋势。

排序

排序功能会对指标进行遵循一定规则的自动排序。

Top N

只展现前几名或后几名的数据。

合计

对数据进行汇总计算。

百分比

百分比计算可以快速计算出一列数据中各自所占的百分比数。

对比

对比分析是指基于相同数据标准下(相同维度指标),由其他影响因素(对比条件)所导致的数据差异。

同环比

快速计算数据的同比与环比数值。

指标模板

通过填写参数对表达式进行灵活修改。

归因分析

对指标明显的上升/下降情况进行分析,自动生成报告,定位影响因素。

抽样

对数据集进行抽样操作。

例行

在 SQL 查询结果的基础上进行数据可视化,生成图表并保存下来,然后进行例行数据更新。

监控

对图表中的相关指标进行监控。

动态维度/动态指标

可以在图表中简单快速地实现对多维度/多指标的切换。

上钻下钻

依据某些字段创建一个层级结构,使得能够快速在可视化项内各层之间向上/下钻取。

别名管理

给维度字段的内容添加新的名称。

数据面板

包含了维度、指标和筛选,将字段放入该区域,将进行查询。

维度

维度就是分析一个指标的角度,常常只有少量的离散的取值。

指标

指标是以不同聚合方式来度量数据的,大部分情况下是数字。定义指标的时候需要指定计算数据的范围、计算的方法,我们称为“统计口径”。

5. 项目中心

名词

说明

项目

项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目

资源

指系统中的仪表盘,数据集,图表等

用户组

用户的集合

行权限控制

对数据集行级别数据进行权限控制

列权限控制

对数据集列级别数据进行权限控制

6. SQL 查询

名词

说明

工作簿

基于某一需要创建的 SQL 查询的集合,里面有多个 SQL 查询框及查询任务

编辑框/编辑器

SQL 查询代码编辑框

查询任务

指某一次 SQL 查询任务

数据源

指 SQL 查询的取数来源,目前 SQL 查询支持的数据源有 Hive 和 Clickhouse

集群

集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的服务平台。具有可扩展性和高可用性。

队列

即集群任务执行队列

解析

对 SQL 查询语句进行语法解析

临时查询

即在[临时工作簿]后新增一个查询编辑框,不会每次都新开一个工作簿

批量查询/batch 查询

即将 SQL 任务按批量查询日期拆成一个个子查询去查询,查询好之后再进行数据合并

7.权限

名词

说明

使用场景

系统

系统指的是整个智能数据洞察平台,文档内容出现的 DataWind 系统/ BI 系统/系统均为此含义;通常您的系统中可能会创建多个项目

项目

项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目

多个部门或者多个项目组