You need to enable JavaScript to run this app.
导航
元数据指标体系说明
最近更新时间:2023.09.13 14:04:13首次发布时间:2023.09.13 14:04:13

1. 行为事件主题数据

行为事件元数据记录平台内不同项目内用户的全部操作行为日志,用于行为审计、用户活跃分析、资源热度等分析内容,其中资源 ID/名称/创建时间等字段主要包含可视化建模/数据集/图表/仪表盘资源信息,如无事件信息则表示资源未被操作访问。

1.1 主题字段列表

字段名字段描述
event_id事件ID
event_type事件类型
event_resource_id事件资源ID
event_resource_type事件资源类型
event_resource_type_name事件资源类型名称
event_resource_name事件资源名称
event_detail事件详情
event_user事件用户
event_module事件模块
event_submodule事件子模块
event_app_id事件所属项目ID
event_action事件行为动作
event_payload事件业务参数.
event_resource_type_name事件资源类型名称
event_timestamp事件时间
resource_id资源ID
resource_name资源名称
resource_owner资源Owner
resource_create_time资源创建时间
resource_app_id资源所属项目ID
resource_type资源类型(包含可视化建模/数据集/图表/仪表盘)
p_datep_date

1.2 实现过程

alt

1.2.1 输入表

aeolus_db.prep_task:任务表 (task_source=0表示可视化建模任务)
aeolus_db.aeolus_data_set :数据集表
aeolus_db.aeolus_dashboard :仪表盘表
aeolus_db.aeolus_report:图表表
aeolus_data_db_aeolus_omega_202201.aeolus_data_table_5_562088_prod 操作日志表域内(CK表)
aeolus_pre_create_db.aeolus_monitor_table 操作日志表ToB(CK表)

1.2.2 实现过程简述

Step1:将可视化建模/数据集/仪表盘/图表均清洗成相同的 schema 结构,采用合并行的方式 Union 数据,如下表。
Step2:将行为日志表剔除无用字段,剔除 uuid/pl_data_set_id,其余保留。
Step3:将清洗好的行为表和各资源的基础信息表 Full Join 在一起,形成结果表。

表名原始字段重命名字段清洗规则

aeolus_db.prep_task

id

resource_id

限制:task_source = 0 表示常规页面创建的可视化建模任务

nameresource_name
owner_email_prefixresource_owner
ctimeresource_create_time
app_idresource_app_id

--

resource_type
user_status

新增的字段,值始终= “可视化建模”

aeolus_db.aeolus_data_setidresource_id
nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
app_idresource_app_id
--resource_type新增的字段,值始终= “数据集”
aeolus_db.aeolus_dashboardidresource_id
nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
app_idresource_app_id
--resource_type新增的字段,值始终= “仪表盘”

aeolus_db.aeolus_report
Left join
aeolus_db.aeolus_data_set

id

resource_id

nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
app_idresource_app_id来自于aeolus_db.aeolus_data_set表
--resource_type新增的字段,值始终= “图表”

2. 资产明细主题数据

资产明细主题数据记录数据集/可视化建模/图表/仪表盘资产明细数据,其中数据集及可视化建模提供调度任务、实例任务及底层表 TTL 资源等信息,可以实现资产统计、任务管理、资源管理等分析。

2.1 主题字段列表

字段名字段描述
app_id项目ID
app_name项目名称
app_status项目状态
app_create_time项目创建时间
app_update_time项目更新时间
resource_id资源ID
resource_name资源名称
resource_owner资源owner
resource_create_time资源创建时间
resource_app_id资源所属项目ID
resource_type资源类型
prep_schedule_conf任务调度配置
prep_execute_status任务运行状态
prep_last_sync_time最近一次运行开始时间
prep_last_sync_end_time最近一次运行结束时间
resource_update_time资源更新时间
resource_delete_time资源删除时间
prep_task_source任务创建来源,0表示可视化建模任务
prep_task_type任务类型,0是离线/1是实时/2是标签
resource_status资源状态, 0是正常/ 1是删除
dataset_connection_mode数据集链接模式,0是抽取模式,1是直连模式
dataset_sync_type数据集同步方式,0:自动同步, 1:定时同步, 2:暂不同步,3:实时同步
dataset_ttl数据集生命周期TTL
instance_id任务实例ID
instance_task_time任务实例业务日期,对应分区P_date
instance_queue任务实例集群队列
instance_name任务实例名称
instance_status任务实例状态,0: 正常, 1: 删除
instance_conf任务实例配置
instance_create_time任务实例创建时间
instance_schedule_time任务实例调度时间
instance_start_time任务实例开始时间
instance_end_time任务实例结束时间
data_table_source_id数据集底表ID
data_table_sla_daytime数据集同步作业SLA
data_table_ttl数据集底表生命周期
data_table_table_size数据集底表存储大小,单位Byte
data_table_line_num数据集底表行数
data_table_status数据集底表状态 0: 正常, 1: 删除, 2删除中
data_table_update_time数据集底表更新时间
data_table_create_time数据集底表创建时间
p_datep_date

2.2 实现过程

alt

2.2.1 输入表

aeolus_db.aeolus_app:项目信息表
aeolus_db.prep_task:任务表 (task_source=0表示可视化建模任务)
aeolus_db.prep_instance:任务实例表
aeolus_db.aeolus_data_set :数据集表
aeolus_db.aeolus_data_table:数据集对应CK表
aeolus_db.aeolus_dashboard :仪表盘表
aeolus_db.aeolus_report:图表表

2.2.2 实现过程简述

Step1:将可视化建模/数据集/仪表盘/图表清洗出必须字段。
Step2:将这些表采用合并行的方式合并在一起。
Step3:将合并好的数据和项目信息关联在一起。

表名原始字段重命名字段清洗规则
aeolus_db.aeolus_appidapp_id
nameapp_name
statusapp_status
ctimeapp_create_time
mtimeapp_update_time

aeolus_db.prep_task
Left join
aeolus_db.prep_instance

id

resource_id

限制:task_source = 0 表示常规页面创建的可视化建模任务

nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
app_idresource_app_id
--resource_type新增的字段,值始终= “可视化建模”
schedule_typeprep_schedule_type
schedule_confprep_schedule_conf
statusresource_status
execute_statusprep_execute_status
last_sync_timeprep_last_sync_time
last_sync_end_timeprep_last_sync_end_time
create_timeresource_create_time
app_idresource_app_id
update_timeresource_update_time
delete_timeresource_delete_time
task_typeprep_task_type
task_sourceprep_task_source
idinstance_idprep_instance
task_timeinstance_task_timeprep_instance
queueinstance_queueprep_instance
nameinstance_nameprep_instance
statusinstance_statusprep_instance
confinstance_confprep_instance
create_timeinstance_create_timeprep_instance
schedule_timeinstance_schedule_timeprep_instance
start_timeinstance_start_timeprep_instance
end_timeinstance_end_timeprep_instance
--resource_type

aeolus_db.aeolus_data_set
Left join
aeolus_db.aeolus_data_table

id

resource_id

nameresource_name
owner_email_prefixresource_owner
ctimeresource_create_time
app_idresource_app_id
connection_modedataset_connection_mode
sync_typedataset_sync_type
statusresource_status
ctimeresource_create_time
mtimeresource_update_time
delete_timeresource_delete_time
ttldataset_ttl

source_id

data_table_source_id

aeolus_data_table

sla_daytimedata_table_sla_daytime
ttldata_table_ttl
table_sizedata_table_table_size
line_numdata_table_line_num
statusdata_table_status
update_timedata_table_update_time
create_timedata_table_create_time
--resource_type新增的字段,值始终= “数据集”
aeolus_db.aeolus_dashboardidresource_id
nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
mtimeresource_update_time
app_idresource_app_id
statusresource_status
--resource_type新增的字段,值始终= “仪表盘”

aeolus_db.aeolus_report
Left join
aeolus_db.aeolus_data_set

id

resource_id

nameresource_name

owner_email_prefix

resource_owner

ctimeresource_create_time
mtimeresource_update_time
app_idresource_app_id来自于aeolus_db.aeolus_data_set表
--resource_type新增的字段,值始终= “图表”

3. 资产关系主题数据

资产关系主题数据记录数据集/可视化建模/图表/仪表盘相互依赖关系,可用于做资产分析、资产查询及血缘查看等分析。

3.1 主题字段列表

字段名字段描述
prep_resource_id可视化建模资源ID
prep_resource_name可视化建模资源名称
prep_resource_owner可视化建模资源owner
prep_resource_create_time可视化建模资源创建时间
prep_resource_app_id可视化建模资源所属项目ID
prep_resource_type可视化建模资源类型
dataset_resource_id数据集资源ID
dataset_resource_app_id数据集资源名称
dataset_resource_name数据集资源owner
dataset_resource_owner数据集资源创建时间
dataset_resource_create_time数据集资源所属项目ID
dataset_resource_type数据集资源类型
report_resource_id图表资源ID
report_resource_name图表资源名称
report_resource_owner图表资源owner
report_resource_create_time图表资源创建时间
report_resource_app_id图表资源所属项目ID
report_resource_type图表资源类型
dashboard_resource_id仪表盘资源ID
dashboard_resource_app_id仪表盘资源所属项目ID
dashboard_resource_name仪表盘资源名称
dashboard_resource_owner仪表盘资源owner
dashboard_resource_create_time仪表盘资源创建时间
dashboard_resource_type仪表盘资源类型
p_datep_date

3.2 实现过程

alt

3.2.1 输入表

aeolus_db.prep_task:任务表 (task_source=0表示可视化建模任务)
aeolus_db.aeolus_data_set :数据集表
aeolus_db.aeolus_dashboard :仪表盘表
aeolus_db.aeolus_dashboard_sheet:仪表盘与Sheet表关系表
aeolus_db.aeolus_sheet_report:Sheet表与图表关系表
aeolus_db.aeolus_report:图表表

3.2.2 实现过程简述

Step1:Prep 表和数据集表进行 full join 获取可视化建模和数据集详细信息及关系。
Step2:图表与数据集关联获取图表与数据集关系,图表归属于一个数据集。
Step3:图表与数据集的关系表做关联至 Step1 的关系表,构建可视化建模/数据集/图表的宽表。
Step4:仪表盘关联 sheet 表,然后关联图表,可以获得仪表盘和图表的关系。
Step5:可视化建模/数据集/图表的宽表 与 Step4 关系表,可以获得最终大宽表。

表名原始字段重命名字段清洗规则

aeolus_db.prep_task
Full join
aeolus_db.aeolus_data_set

Left join
aeolus_db.aeolus_report

id

prep_resource_id

prep_task

nameprep_resource_nameprep_task
owner_email_prefixprep_resource_ownerprep_task
ctimeprep_resource_create_timeprep_task
app_idprep_resource_app_idprep_task
iddataset_resource_idaeolus_data_set
app_iddataset_resource_app_idaeolus_data_set
namedataset_resource_nameaeolus_data_set

owner_email_prefix

dataset_resource_owner

aeolus_data_set

ctimedataset_resource_create_timeaeolus_data_set
idreport_resource_idaeolus_report
namereport_resource_nameaeolus_report
owner_email_prefixreport_resource_owneraeolus_report
ctimereport_resource_create_timeaeolus_report
app_idreport_resource_app_idaeolus_report

aeolus_db.aeolus_dashboard
Left join
aeolus_db.aeolus_dashboard_sheet
Left join
aeolus_db.aeolus_report

id

dashboard_resource_id

aeolus_dashboard

app_iddashboard_resource_app_idaeolus_dashboard
namedashboard_resource_nameaeolus_dashboard
owner_email_prefixdashboard_resource_owneraeolus_dashboard
ctimedashboard_resource_create_timeaeolus_dashboard

4. 用户主题数据

用户主题数据记录不同项目下用户数据,用于统计项目变化、用户变化等分析数据。

4.1 主题字段列表

字段名字段描述
app_id项目ID
app_name项目名称
app_status项目状态
app_create_time项目创建时间
app_update_time项目更新时间
user_id用户id
user_app_id用户所属项目ID
user_app_status用户项目内状态
user_app_create_time用户添加至项目添加时间
user_app_update_time用户添加至项目更新时间
user_email_prefix用户邮箱前缀
user_name用户中文名称
user_status用户在职状态
user_create_time用户集团内添加时间
user_update_time用户集团内更新时间
p_datep_date

4.2 实现过程

alt

4.2.1 输入表

aeolus_db.aeolus_app:项目信息表
aeolus_db.aeolus_app_user:项目用户表
aeolus_db.aeolus_user:用户信息表

4.2.2 实现过程简述

Step1: 将 aeolus_db.aeolus_app_user 与 aeolus_db.aeolus_user 关联,获取不同项目内用户的状态,包含用户在集团内的数据和项目内数据。
Step2: 将项目用户数据与项目信息关联,添加项目信息。

表名原始字段重命名字段清洗规则
aeolus_db.aeolus_appidapp_id
nameapp_name
statusapp_status
create_timeapp_create_time
update_timeapp_update_time

aeolus_db.aeolus_app_user
Left join
aeolus_db.aeolus_user

id

user_id

aeolus_app_user

iduser_app_idaeolus_app_user
statususer_app_statusaeolus_app_user
ctimeuser_app_create_timeaeolus_app_user
mtimeuser_app_update_timeaeolus_app_user
user_email_prefixuser_email_prefixaeolus_user
nameuser_nameaeolus_user
statususer_statusaeolus_user
ctimeuser_create_timeaeolus_user
mtimeuser_update_timeaeolus_user