You need to enable JavaScript to run this app.
文档中心
大数据研发治理套件(私有化)

大数据研发治理套件(私有化)

复制全文
概述
基本概念
复制全文
基本概念

指标平台以维度建模为理论基础,划分并定义业务线、指标、数据模型, 支持导入多种数据源构建模型,提供多样指标构建方式,消除指标二义性,保证指标数据出口一致性。
其中,指标的元信息分为业务元信息和技术信息。

  • 业务元信息包含业务定义、详细定义、业务负责人、技术负责人等(不涉及物理实现) 。
  • 技术信息包含相关模型,支持在指标平台上通过数据源直接构建模型。

指标平台相关术语解释说明如下表所示。

名词

解释说明

举例

业务线

带有业务含义的相对独立的业务空间。在相同业务线内对指标进行规范化定义,保证相同业务线下,不同产品之间指标的规范化命名和一致性定义。同时,可在业务线下进行角色、资源、权限的管理设置。

电商业务线、传媒业务线

技术指标

基于数据仓库模型设计和业务场景,进行原子指标、修饰词的抽象,基于原子指标和修饰词生成全局唯一的技术指标(包括衍生指标、复合指标)。技术指标主要用于与数仓模型字段的映射和描述指标的技术信息(包括字段类型、技术口径等)。

最近一天观看用户数、最近7天观看用户数

业务指标

在技术指标基础上去掉时间周期后生成(系统自动生成),全局唯一。业务指标主要用于业务定义的维护、业务属性的维护、指标元数据的消费。

观看用户数

数据域

是将业务过程或者维度进行抽象的集合,是否归到一个数据域,更多的是看数据是否来自同一个系统。

交易域

业务过程

不可拆分的行为事件,指在数据域下用户的动作,数据域下业务过程唯一。

下单、支付、确认收货

度量

用于生成原子指标,是业务定义中不可再拆分的指标。

订单金额

修饰词

用于描述原子指标发生的场景、满足的条件。

直播载体、商品卡载体

修饰类型

对相同类型修饰词进行归类。

载体类型

维度

数据视角下要计算的指标粒度。

商品ID、商家ID

时间周期

用来统计指标计算的时间范围,用来修饰原子指标计算的周期时间。

最近1天、最近30天

指标单位

用于表示原子指标、衍生指标、复合指标的计算单位。

元、秒

数据类型

用于表示数据存储的类型。

bigint,decimal

未拆解指标

所有创建业务指标时构建的临时技术指标设置类型为未拆解。

原子指标

需要计算的指标,但是不参与计算,只是用来归类指标,等于业务过程+度量(支付订单金额),全局唯一。

支付订单金额

衍生指标

需要计算的指标,是对原子指标在业务统计范围的一个圈定。

最近1天支付订单金额

复合指标

衍生、复合指标之间可以通过四则运算或者统计方法生成复合指标。

最近一天支付客单价=最近1天支付订单金额/最近1天支付用户数

维度

维度即进行统计的对象。通常情况下,维度是实际存在、不因事件发生就存在的实体。创建维度,即从顶层规范业务中的实体(主数据),并保证实体的唯一性。

  • 实体维度:对应一个实体,需要定义维度的主键和属性,以及维度的主从关系。
  • 码值维度:列举及标准化枚举值以标识枚举维度对象。
  • 虚拟维度:不需要提前建设管理维度信息,直接使用模型中的字段定义为虚拟维度,指标即可根据该字段做group by的查询。
  • 实体维度:主播(anchor),主键为anchor_id,有主播类型、所属工会、注册日期等属性,注册日期可以关联日期维度,所属工会关联工会维度。
  • 码值维度:0表示女,1代表男。

模型

数据模型由指标字段、维度字段组成,其数据来源可以是物理数据源,也可以是关联数据源。

数据仓库模型

指标级别

指标有不同的重要程度,对指标进行分级定义,明确业务的核心指标,并投入更多精力维护核心指标口径的正确性,可以帮助我们更好的维护一个健壮的指标体系。

  • D1:公司级指标,支撑公司战略决策,需要在公司范围内统一。
  • D2:业务级核心指标,支持业务决策和拆分D1级指标。
  • D3:其他分析型指标,灵活,常用于分析和辅助业务发展。
  • D1:日活、新增、留存
  • D2:直播时长、直播观看人数、搜索次数
  • D3:签约主播直播时长、主动搜索次数
最近更新时间:2025.03.28 14:45:00
这个页面对您有帮助吗?
有用
有用
无用
无用