名词 | 说明 |
---|---|
数据集 | 数据集是由一张或多张表组成的数据模型,是可视化查询、图表、看板的基础,在使用这三个模块前,需要在“数据集”模块建立数据连接,将数据接入 DataWind。 |
数据类型 | 数据类型是为了把数据分成所需内存大小不同的数据,需要用大数据的时候才需要申请大内存。这样,能够充分合理地利用内存。 |
表达式 | 可通过sql编辑表达式,获取想要的数据。如你在原表中有一个时间戳字段 creat_time:1522920936,实际上你需要一个月份字段,则可以利用函数截取一个新字段 creat_month:2019-08,函数为 toMonth(toDateTime(create_time)) |
数据生命周期 | 数据生命周期可根据日期定期清理无用数据,释放公共资源。 |
同步类型 | 将指定数据库的数据定期搬运到 DataWind 数据库中。 |
主键 | 数据集设置主键后查询会更快。一般选择每次查询都会指定的过滤字段作为主键。主键可以有多个,第 1 个主键字段作用最大,其余依次递减。 |
分区 | 数据集使用分区来水平分散压力,将数据从物理上移到距离使用最频繁的用户最近的地方。 |
分片 | 数据集使用分片字段,以确保数据均匀的分布在各节点下。分片能够提升查询速度。 |
抽样字段 | 查询数据集时,抽样查询少量数据能提升查询速度。默认根据抽样字段进行 HASH。 |
抽样占比 | 可视化查询时依照抽样字段进行抽样,占比越小,数据量越小,可视化查询速度越快。 |
名词 | 说明 |
---|---|
数据建模 | 按照某种数据处理逻辑将元数据数据清洗、加工及生产的过程叫做数据建模。 |
数据连接 | 构建与各类数据源打通的配置能力,实现数据读取的首要功能。 |
画布 | 将各功能模块按照有向流程组建成一种数据加工流程的可视化效果。 |
算子 | 画布中数据读取、加工、算法、数据输出能力的集成能力,对应画布中每个方块。 |
连线 | 算子间的有向关系,指代两个算子间数据流转的通道。 |
数据集 | 参考数据集说明, 是数据准备的基础建模工具,提供基础的多表关联的数据建模能力,同时也是可被产品使用的数据容器,包含ClickHouse数据集/Hive数据集。 |
实时任务 | 数据源数据是实时更新且数据流实时加工的可视化建模任务。 |
离线任务 | 数据源数据是天级/小时级等更新(即每天/每小时更新一次)且数据流程加工过程是定时执行或手动执行的可视化建模任务。 |
名词 | 说明 |
---|---|
标签页 | 标签页为多个页面的集合,可以为不同页面显示不同标题。 |
公共筛选器 | 可以同时作用多张图表的筛选器;筛选器用于缩小图表中显示的数据选择范围。 |
图层顺序 | 不同元素重合时,将按照图层顺序进行显示。 |
组合 | 将不同元素视为一个整体,可以同时进行设置和调整移动位置。 |
Markdown | Markdown 是一种纯文本格式的标记语言。能够通过简单的标记语法,使普通文本内容具有特定格式。 |
撤销 | 回到最近一次操作前的状态。 |
重做 | 取消撤销。 |
左对齐 | 2 个及以上元素靠左边对齐。 |
垂直居中对齐 | 2 个及以上元素在垂直方向上的中心线对齐。 |
右对齐 | 2 个及以上元素靠右边对齐。 |
顶部对齐 | 2 个及以上元素靠上边对齐。 |
水平居中对齐 | 2 个及以上元素在水平方向上的中心线对齐。 |
底部对齐 | 2 个及以上元素靠下边对齐。 |
水平均匀分布 | 2 个及以上元素在水平方向上中心点均匀分布。 |
垂直均匀分布 | 2 个及以上元素在垂直方向上中心点均匀分布。 |
等间距线 | 在改变元素位置或改变元素大小时 ,移动元素和对照元素间距相等或出现相同高宽时出现的提示线。 |
参考线 | 在改变元素位置或改变元素大小时 ,辅助布局出现的位置提示线。 |
缩放 | 缩小或放大页面。 |
页面设置 | 可选择常用的页面尺寸,或自定义页面宽高。 |
外观设置 | 可设置页面背景色,也可以在页面添加网格线。 |
图表设置 | 可设置图表标题是否隐藏、图表标题格式;对表格可以进行显示设置,选择标准或者自适应表的高宽。 |
变化设置 | 可对元素的位置XY坐标设置,也可对元素的面积宽高进行设置。 |
添加描述 | 对图表添加解释说明。 |
名词 | 说明 |
---|---|
表格 | 表格是数据的基础展示形式,通过简单地配置维度和指标,即可展示出对应的明细数据。同时表格还支持样式配置、条件格式、列排序和固定列等操作。 |
透视表 | 透视表将数据按照列维度、行维度进行汇总计算和展现。通过简单地配置列维度、行维度和指标,即可展示出透视表。 |
明细表 | 明细表是一种展示明细数据的表格。 |
柱状图 | 柱状图通常用来描述数据在一段时间内、不同地区间的变化。 |
条形图 | 条形图可以看作是横向的柱状图,通常用来表示数据在不同时间或者不同条件下的变化。 |
折线图 | 折线图一般用来查看数据的变化趋势。 |
面积图 | 面积图与折线图相近,区别在于面积图会在折线与X轴间填充颜色。适合于描述数据的变化趋势,和部分数据对整体的贡献。 |
双轴图 | 双轴图是指有 2 个 Y 轴的数据图表,多为柱状图+折线图的结合,图表显示更为直观。适用于分析两个相差较大的数据、不同数据走势、数据同环比分析等场景。 |
饼图 | 饼图中,每个扇区圆心角大小由所代表的数量占整体的比例决定,常用来展示部分数据的数量占整体的比例。 |
地图 | 地图功能支持展示数量在不同地域的差异。 |
双向条形图 | 双向条形图,使用正向和反向的柱子显示类别之间的数值比较。 |
组合图 | 组合图通常用来对比展示同一维度的多个指标及变化情况。 |
散点图 | 散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。 |
词云 | 词云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据;每个词的重要性以字体大小显示。 |
直方图 | 直方图,形状类似柱状图却有着与柱状图完全不同的含义。直方图牵涉统计学的概念,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。 |
指标卡 | 指标卡可用于直观展示某一指标值及其相关指标或变化趋势。 |
排序 | 排序功能会对指标进行遵循一定规则的自动排序。 |
Top N | 只展现前几名或后几名的数据。 |
合计 | 对数据进行汇总计算。 |
百分比 | 百分比计算可以快速计算出一列数据中各自所占的百分比数。 |
对比 | 对比分析是指基于相同数据标准下(相同维度指标),由其他影响因素(对比条件)所导致的数据差异。 |
同环比 | 快速计算数据的同比与环比数值。 |
指标模板 | 通过填写参数对表达式进行灵活修改。 |
归因分析 | 对指标明显的上升/下降情况进行分析,自动生成报告,定位影响因素。 |
抽样 | 对数据集进行抽样操作。 |
例行 | 在 SQL 查询结果的基础上进行数据可视化,生成图表并保存下来,然后进行例行数据更新。 |
监控 | 对图表中的相关指标进行监控。 |
动态维度/动态指标 | 可以在图表中简单快速地实现对多维度/多指标的切换。 |
上钻下钻 | 依据某些字段创建一个层级结构,使得能够快速在可视化项内各层之间向上/下钻取。 |
别名管理 | 给维度字段的内容添加新的名称。 |
数据面板 | 包含了维度、指标和筛选,将字段放入该区域,将进行查询。 |
维度 | 维度就是分析一个指标的角度,常常只有少量的离散的取值。 |
指标 | 指标是以不同聚合方式来度量数据的,大部分情况下是数字。定义指标的时候需要指定计算数据的范围、计算的方法,我们称为“统计口径”。 |
名词 | 说明 |
---|---|
项目 | 项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目 |
资源 | 指系统中的仪表盘,数据集,图表等 |
用户组 | 用户的集合 |
行权限控制 | 对数据集行级别数据进行权限控制 |
列权限控制 | 对数据集列级别数据进行权限控制 |
名词 | 说明 |
---|---|
工作簿 | 基于某一需要创建的 SQL 查询的集合,里面有多个 SQL 查询框及查询任务 |
编辑框/编辑器 | SQL 查询代码编辑框 |
查询任务 | 指某一次 SQL 查询任务 |
数据源 | 指 SQL 查询的取数来源,目前 SQL 查询支持的数据源有 Hive 和 Clickhouse |
集群 | 集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的服务平台。具有可扩展性和高可用性。 |
队列 | 即集群任务执行队列 |
解析 | 对 SQL 查询语句进行语法解析 |
临时查询 | 即在[临时工作簿]后新增一个查询编辑框,不会每次都新开一个工作簿 |
批量查询/batch 查询 | 即将 SQL 任务按批量查询日期拆成一个个子查询去查询,查询好之后再进行数据合并 |
名词 | 说明 | 使用场景 |
---|---|---|
系统 | 系统指的是整个智能数据洞察平台,文档内容出现的 DataWind 系统/ BI 系统/系统均为此含义;通常您的系统中可能会创建多个项目 | |
项目 | 项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目 | 多个部门或者多个项目组 |