You need to enable JavaScript to run this app.
导航
产品名词解释
最近更新时间:2024.01.03 14:56:50首次发布时间:2021.02.23 10:42:03
1. 数据集
名词说明
数据集数据集是由一张或多张表组成的数据模型,是可视化查询、图表、看板的基础,在使用这三个模块前,需要在“数据集”模块建立数据连接,将数据接入 DataWind。
数据类型数据类型是为了把数据分成所需内存大小不同的数据,需要用大数据的时候才需要申请大内存。这样,能够充分合理地利用内存。
表达式可通过sql编辑表达式,获取想要的数据。如你在原表中有一个时间戳字段 creat_time:1522920936,实际上你需要一个月份字段,则可以利用函数截取一个新字段 creat_month:2019-08,函数为 toMonth(toDateTime(create_time))
数据生命周期数据生命周期可根据日期定期清理无用数据,释放公共资源。
同步类型将指定数据库的数据定期搬运到 DataWind 数据库中。
定时:上游数据库的数据产出,根据指定的时间开始同步。
暂停:首次同步完成后不再同步。
主键数据集设置主键后查询会更快。一般选择每次查询都会指定的过滤字段作为主键。主键可以有多个,第 1 个主键字段作用最大,其余依次递减。
分区数据集使用分区来水平分散压力,将数据从物理上移到距离使用最频繁的用户最近的地方。
分片数据集使用分片字段,以确保数据均匀的分布在各节点下。分片能够提升查询速度。
抽样字段查询数据集时,抽样查询少量数据能提升查询速度。默认根据抽样字段进行 HASH。
抽样占比可视化查询时依照抽样字段进行抽样,占比越小,数据量越小,可视化查询速度越快。
2. 可视化建模
名词说明
数据建模按照某种数据处理逻辑将元数据数据清洗、加工及生产的过程叫做数据建模。
数据连接构建与各类数据源打通的配置能力,实现数据读取的首要功能。
画布将各功能模块按照有向流程组建成一种数据加工流程的可视化效果。
算子画布中数据读取、加工、算法、数据输出能力的集成能力,对应画布中每个方块。
连线算子间的有向关系,指代两个算子间数据流转的通道。
数据集参考数据集说明, 是数据准备的基础建模工具,提供基础的多表关联的数据建模能力,同时也是可被产品使用的数据容器,包含ClickHouse数据集/Hive数据集。
实时任务数据源数据是实时更新且数据流实时加工的可视化建模任务。
离线任务数据源数据是天级/小时级等更新(即每天/每小时更新一次)且数据流程加工过程是定时执行或手动执行的可视化建模任务。
3. 仪表盘
名词说明
标签页标签页为多个页面的集合,可以为不同页面显示不同标题。
公共筛选器可以同时作用多张图表的筛选器;筛选器用于缩小图表中显示的数据选择范围。
图层顺序不同元素重合时,将按照图层顺序进行显示。
组合将不同元素视为一个整体,可以同时进行设置和调整移动位置。
MarkdownMarkdown 是一种纯文本格式的标记语言。能够通过简单的标记语法,使普通文本内容具有特定格式。
撤销回到最近一次操作前的状态。
重做取消撤销。
左对齐2 个及以上元素靠左边对齐。
垂直居中对齐2 个及以上元素在垂直方向上的中心线对齐。
右对齐2 个及以上元素靠右边对齐。
顶部对齐2 个及以上元素靠上边对齐。
水平居中对齐2 个及以上元素在水平方向上的中心线对齐。
底部对齐2 个及以上元素靠下边对齐。
水平均匀分布2 个及以上元素在水平方向上中心点均匀分布。
垂直均匀分布2 个及以上元素在垂直方向上中心点均匀分布。
等间距线在改变元素位置或改变元素大小时 ,移动元素和对照元素间距相等或出现相同高宽时出现的提示线。
参考线在改变元素位置或改变元素大小时 ,辅助布局出现的位置提示线。
缩放缩小或放大页面。
页面设置可选择常用的页面尺寸,或自定义页面宽高。
外观设置可设置页面背景色,也可以在页面添加网格线。
图表设置可设置图表标题是否隐藏、图表标题格式;对表格可以进行显示设置,选择标准或者自适应表的高宽。
变化设置可对元素的位置XY坐标设置,也可对元素的面积宽高进行设置。
添加描述对图表添加解释说明。
4. 可视化查询
名词说明
表格表格是数据的基础展示形式,通过简单地配置维度和指标,即可展示出对应的明细数据。同时表格还支持样式配置、条件格式、列排序和固定列等操作。
透视表透视表将数据按照列维度、行维度进行汇总计算和展现。通过简单地配置列维度、行维度和指标,即可展示出透视表。
明细表明细表是一种展示明细数据的表格。
柱状图柱状图通常用来描述数据在一段时间内、不同地区间的变化。
条形图条形图可以看作是横向的柱状图,通常用来表示数据在不同时间或者不同条件下的变化。
折线图折线图一般用来查看数据的变化趋势。
面积图面积图与折线图相近,区别在于面积图会在折线与X轴间填充颜色。适合于描述数据的变化趋势,和部分数据对整体的贡献。
双轴图双轴图是指有 2 个 Y 轴的数据图表,多为柱状图+折线图的结合,图表显示更为直观。适用于分析两个相差较大的数据、不同数据走势、数据同环比分析等场景。
饼图饼图中,每个扇区圆心角大小由所代表的数量占整体的比例决定,常用来展示部分数据的数量占整体的比例。
地图地图功能支持展示数量在不同地域的差异。
双向条形图双向条形图,使用正向和反向的柱子显示类别之间的数值比较。
组合图组合图通常用来对比展示同一维度的多个指标及变化情况。
散点图散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
词云词云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据;每个词的重要性以字体大小显示。
直方图直方图,形状类似柱状图却有着与柱状图完全不同的含义。直方图牵涉统计学的概念,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。
指标卡指标卡可用于直观展示某一指标值及其相关指标或变化趋势。
排序排序功能会对指标进行遵循一定规则的自动排序。
Top N只展现前几名或后几名的数据。
合计对数据进行汇总计算。
百分比百分比计算可以快速计算出一列数据中各自所占的百分比数。
对比对比分析是指基于相同数据标准下(相同维度指标),由其他影响因素(对比条件)所导致的数据差异。
同环比快速计算数据的同比与环比数值。
指标模板通过填写参数对表达式进行灵活修改。
归因分析对指标明显的上升/下降情况进行分析,自动生成报告,定位影响因素。
抽样对数据集进行抽样操作。
例行在 SQL 查询结果的基础上进行数据可视化,生成图表并保存下来,然后进行例行数据更新。
监控对图表中的相关指标进行监控。
动态维度/动态指标可以在图表中简单快速地实现对多维度/多指标的切换。
上钻下钻依据某些字段创建一个层级结构,使得能够快速在可视化项内各层之间向上/下钻取。
别名管理给维度字段的内容添加新的名称。
数据面板包含了维度、指标和筛选,将字段放入该区域,将进行查询。
维度维度就是分析一个指标的角度,常常只有少量的离散的取值。
指标指标是以不同聚合方式来量度数据的,大部分情况下是数字。定义指标的时候需要指定计算数据的范围、计算的方法,我们称为“统计口径”。
5. 项目中心
名词说明
项目项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目
资源指系统中的仪表盘,数据集,图表等。
用户组为用户的集合。
行权限控制对数据集行级别数据进行权限控制。
列权限控制对数据集列级别数据进行权限控制。
6. SQL 查询
名词说明
工作簿基于某一需要创建的 SQL 查询的集合,里面有多个 SQL 查询框及查询任务。
编辑框/编辑器SQL 查询代码编辑框。
查询任务指某一次 SQL 查询任务。
数据源指 SQL 查询的取数来源,目前 SQL 查询支持的数据源有 Hive 和 Clickhouse。
集群集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的服务平台。具有可扩展性和高可用性。
队列即集群任务执行队列。
解析对 SQL 查询语句进行语法解析。
临时查询即在[临时工作簿]后新增一个查询编辑框,不会每次都新开一个工作簿。
批量查询/batch 查询即将 SQL 任务按批量查询日期拆成一个个子查询去查询,查询好之后再进行数据合并。
7.权限
名词说明使用场景
系统系统指的是整个智能数据洞察平台,文档内容出现的 DataWind 系统/ BI 系统/系统均为此含义;通常您的系统中可能会创建多个项目。
项目项目指的是是系统中的一个独立工作空间,一般以业务或需要来进行划分。不同项目之间的资源和权限控制相互独立。您可以根据业务主题、业务部门等专题创建分析项目,在分析项目内,团队成员可以创建可视化查询的图表和仪表盘等;产品主功能都在具体的项目中,每个项目之间是逻辑隔离的状态,每个项目内的功能操作与设置不会影响其他项目。多个部门或者多个项目组