You need to enable JavaScript to run this app.
导航
数据集信息 API
最近更新时间:2025.05.21 15:06:27首次发布时间:2024.03.15 14:50:59
我的收藏
有用
有用
无用
无用

1. 概述

本文为您介绍的是“数据集信息类的 Open API”,您将了解到用户可以通过 API 进行查看数据集详情页、编辑页的基础信息以及更新基础信息、设置标签等操作。
注意:在您使用本文所述的 API 前,还需完成接入 JWT-Token 和申请 Token 的前置操作,请先了解调用方式,详情可阅读调用方式

2. 接口介绍

2.1 查看数据集信息-详情页

  • 权限需求

    资源

    权限

    数据集

    read

  • 接口描述与说明:获取数据集详情页展示的数据集信息内容
    Image

请求说明

  • 请求地址:{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/overview

请求示例

curl --location --request GET '{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/overview' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}'

请求参数

名称

类型

必选

示例值

描述

dataSetId

integer

123

数据集ID,获取方式见资源 ID 获取方式

返回参数

参数

类型

描述

accessCount

integer

数据集近30天相关图表页面浏览量(PV)

appId

integer

项目Id

connectionMode

integer

数据集连接模式[0:抽取, 1:直连]

ctime

datetime

数据集创建时间

dagTagConf.dimTbNodes

list

维度表节点Id

demoUrl

string

数据集使用说明

descr

string

数据集描述

doradoPriority

string

同步任务优先级[normal、high、super_high]

driverName

string

数据库驱动程序名称

editable

boolean

数据集是否可以修改[true、false]

frequency

string

数据集同步的频率[daily、hourly、weekly、monthly]

hot

integer

访问热度[0:没热度]

id

integer

数据集ID

lastSyncTime

datetime

最近同步时间

lineNum

integer

数据集所存数据条数

mtime

datetime

数据集最近修改时间

name

string

数据集名称

onPrivateCluster

integer

数据集是否建立于私有集群[0:不是私有集群;1:是私有集群]

roleList

list

当前token身份拥有的数据集权限 [admin所有者"、read_role读角色、 write_role写角色"、view_only_role仅阅览角色"、 read_all_role全局查看角色]

size

float

数据集所存数据大小[单位是动态的,可能是KB, MB, GB...]

sourceKey

string

数据集建立/输出来源 [abi, cdp, prep]
说明:prep表示通过可视化建模生成的数据集

status

integer

数据集状态;0为正常状态

syncMode

integer

同步模式[0: Bdb各种to ClickHouse 通道任务、1: 可视化建模任务、2: Bdp hsql 任务,利用tqs执行导入]

syncType

integer

同步调度模式[1为自动同步; 2为手动同步]

ttl

integer

数据集生命周期 -> 数据保存周期,默认7天
说明:定义是数据集的生命周期,实际指的是数据集的数据保存周期。比如默认7天的话,那么7天之前生成的数据都会被删除。

type

integer

数据集类型[常见的几种:0: ClickHouse表作为数据源生成的数据集、2: Hive表作为数据源生成的数据集、8: 自定义SQL生成的数据集、10: MySQL表作为数据源生成的数据集、22: Prep类型的数据集]

writePartition

integer

写入分区 [0为写入天分区; 1为写入天+小时分区]

sensitiveConf

string

数据集脱敏设置[ undef:未设置脱敏 sensitiveWithoutDe:涉敏未脱敏 sensitiveWithDe:涉敏已脱敏 unsensitive不涉敏]

返回示例

{
    "code": "aeolus/ok",
    "data": {
        "accessCount": 0,
        "appId": 77*****,
        "connectionMode": 0,
        "ctime": "2022-12-14 12:17:54",
        "dagTagConf": {
            "dimTbNodes": []
        },
        "dataSetLabelType": 0,
        "demoUrl": "http://xxx.com",
        "descr": "这是一段描述,描述数据集的作用",
        "disablePreview": 0,
        "doradoPriority": "normal",
        "driverName": "click_house",
        "editable": true,
        "frequency": "daily",
        "groupType": 0,
        "hot": 0,
        "id": {{dataSetId}},
        "isAppAdminView": 1,
        "lastSyncTime": "2022-12-14 12:38",
        "lineNum": "56",
        "mtime": "2022-12-14 12:18",
        "name": "测试open-api专用数据集1",
        "onPrivateCluster": 0,
        "ownerEmailPrefix": "userEmailPrefix",
        "parentId": 3075,
        "partitionRange": [
            {
                "id": 158**********,
                "max": "2022-12-13",
                "min": "2022-12-13",
                "name": "p_date"
            }
        ],
        "previewInfo": "",
        "retryNum": 0,
        "roleList": [
            {
                "action": "admin",
                "roleName": "所有者"
            },
            {
                "action": "view_only_role",
                "roleName": "仅阅览角色"
            },
            {
                "action": "write_role",
                "roleName": "写角色"
            },
            {
                "action": "read_role",
                "roleName": "读角色"
            }
        ],
        "size": "2.86KB",
        "slaStatus": 0,
        "sourceKey": "abi",
        "status": 0,
        "statusDesc": "正常",
        "syncMode": 2,
        "syncType": 1,
        "tagInfo": null,
        "thirdPartyConf": {},
        "ttl": 7,
        "type": 22,
        "uneditableReason": null,
        "writePartition": 0,
        "yarnName": "root.default_hrtech_da_pm"
    },
    "msg": "成功"
}

2.2 查看数据集完整信息-编辑页

  • 权限需求

    资源

    权限

    数据集

    read

  • 接口描述与说明获取数据集完整信息,对应前端的数据集编辑页
    Image

请求说明

请求地址:{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/info

请求示例

curl --location --request GET '{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/info' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}'

请求参数

参数

类型

必选

示例值

描述

dataSetId

integer

123

数据集ID,获取方式见资源 ID 获取方式

返回参数

参数(jsonPath)

类型

描述

$.baseConf

object

数据集基础内容

$.baseConf.appId

integer

项目Id

$.baseConf.demoUrl

string

数据集使用说明

$.baseConf.name

string

数据集名称

$.baseConf.ownerEmailPrefix

string

数据集拥有者

$.baseConf.parentId

integer

数据集所在文件夹,0则代表在根目录

$.baseConf.syncMode

integer

同步模式 [1为手动;2为自动]
Image

$.baseConf.type

integer

数据集类型[常见的几种:0: ClickHouse表作为数据源生成的数据集、2: Hive表作为数据源生成的数据集、8: 自定义SQL生成的数据集、10: MySQL表作为数据源生成的数据集、22: Prep类型的数据集]

$.dagTagConf.dimTbNodes

list

数据集维度表节点 nodeId

$.syncConf

object

数据集同步任务配

$.whereConf

object

数据集模型数据源节点筛选条件及全局筛选条件

返回示例

{
    "code": "aeolus/ok",
    "data": {
        "baseConf": {
            "appId": 77*****,
            "connectionMode": 0,
            "demoUrl": null,
            "descr": "这是一段描述,描述数据集的作用",
            "generalTags": [],
            "groupType": 0,
            "id": {{dataSetId}},
            "isAuthEnabled": 1,
            "isIntelligentSyncEnable": 1,
            "lineOfBusiness": [],
            "name": "测试open-api专用数据集1",
            "ownerEmailPrefix": "userEmailPrefix",
            "parentId": 3075,
            "productName": "",
            "regionType": [],
            "syncMode": 2,
            "thirdPartyConf": null,
            "type": 22
        },
        "dagTagConf": {
            "dimTbNodes": []
        },
        "dimMetList": [
            {
                "calcType": null,
                "dataFormat": null,
                "dataTypeName": "date",
                "defaultDataTypeName": "date",
                "descr": "p_date",
                "dimMetCategoryId": null,
                "dimMetCategoryType": null,
                "dimMetMixOrder": 0,
                "dimMetOrder": 0,
                "dimMetThirdPartyConf": null,
                "dimMetVariety": 1,
                "editable": 0,
                "errCode": "ok",
                "expr": "p_date",
                "exprAsDim": null,
                "fieldList": "[\"p_date\"]",
                "fullExpr": "p_date",
                "groupType": 0,
                "hitFilterRuleList": [],
                "id": 158**********,
                "isDeletedField": 0,
                "isPartitionField": 1,
                "lodType": null,
                "mapType": 0,
                "name": "p_date",
                "operationCode": 0,
                "ownerEmailPrefix": "userEmailPrefix",
                "paramIdList": [],
                "showExpr": 1,
                "visible": 1
            },
            .........
        ],
        "labelConf": {
            "dataSetLabelType": 0,
            "labelParams": null,
            "subjectList": null
        },
        "linkConf": [],
        "nodeConf": [
            {
                "clusterName": "cn",
                "dataSourceId": 25***,
                "dataSourceType": "ch_excel",
                "dbName": "aeolus_excel_upload_aeolus_toy",
                "displayDbName": "配比四刷-v4",
                "fields": [
                    {
                        "alias": "`字段四`",
                        "comment": null,
                        "isDynamicPartition": false,
                        "isSelect": true,
                        "isSourceTableField": false,
                        "name": "字段四",
                        "prepType": "string",
                        "status": 0,
                        "type": "Nullable(String)"
                    },
                    {
                        "alias": "`字段一`",
                        "comment": null,
                        "isDynamicPartition": false,
                        "isSelect": true,
                        "isSourceTableField": false,
                        "name": "字段一",
                        "prepType": "string",
                        "status": 0,
                        "type": "Nullable(String)"
                    },
                    {
                        "alias": "`字段三`",
                        "comment": null,
                        "isDynamicPartition": false,
                        "isSelect": true,
                        "isSourceTableField": false,
                        "name": "字段三",
                        "prepType": "string",
                        "status": 0,
                        "type": "Nullable(String)"
                    },
                    {
                        "alias": "`字段二`",
                        "comment": null,
                        "isDynamicPartition": false,
                        "isSelect": true,
                        "isSourceTableField": false,
                        "name": "字段二",
                        "prepType": "string",
                        "status": 0,
                        "type": "Nullable(String)"
                    }
                ],
                "fileId": "13516",
                "fullOption": false,
                "hiveOwner": "userEmailPrefix",
                "lastDdlTime": "2022-12-13 12:49:00",
                "metadataLink": "https://data.bytedanc*.net/coral/datamap/detail/table_info/clickhouse/aeolus_excel_upload_aeolus_toy/table_4f0cc551_9dfa_****_****_**********#group=default",
                "nodeId": "77b3df39-834c-4da4-908e-4b54846bc599",
                "nodeType": "table",
                "params": {
                    "extractType": "{\"key\":\"full\"}"
                },
                "partitionConfList": [],
                "query": "",
                "schemaName": "Sheet1",
                "tableAlias": "table_4f0cc551_9dfa_4915_****_************",
                "tableRowFilter": {},
                "tbId": "cn//aeolus_excel_upload_aeolus_toy//table_4f0cc551_9dfa_4915_****_************",
                "tbName": "table_4f0cc551_9dfa_4915_****_************"
            }
        ],
        "parseEngine": 0,
        "syncConf": {
            "backtrackingConf": {
                "dateRange": {
                    "endDate": "2022-12-13",
                    "startDate": "2022-12-13"
                },
                "enable": 1
            },
            "doradoPriority": "normal",
            "frequency": "daily",
            "monitorConf": {
                "alarmRules": [
                    {
                        "failedAlarmItems": [
                            {
                                "item": "retry_failed"
                            }
                        ],
                        "id": 6826,
                        "name": "auto_aeolus_rule_{{dataSetId}}_167099*******_dev",
                        "normalNoticeConf": [
                            {
                                "dutySchedules": [],
                                "noticeChannel": "lark",
                                "users": [
                                    "userEmailPrefix"
                                ]
                            }
                        ],
                        "resultAlarmItems": [],
                        "timeoutAlarmItems": []
                    }
                ]
            },
            "paramsConfList": [
                {
                    "name": "tqs.query.auto.retry.enable",
                    "value": "true"
                }
            ],
            "performanceSettings": {
                "chQueryParams": {},
                "clusterName": "cnch_alpha_lq",
                "cnchVwDefault": "vw_default",
                "cnchVwWrite": "vw_write",
                "dataSourceId": 14*,
                "driverName": "click_house",
                "partitionKey": [
                    "p_date"
                ],
                "primaryKeyList": [],
                "sampleKey": null,
                "sampleRate": 1.0,
                "shardKey": null
            },
            "retryInterval": 5,
            "retryNum": 1,
            "scheduleDay": "0",
            "scheduleTime": "00:00",
            "scheduleTimeType": 0,
            "slaDaytime": null,
            "slaStatus": 0,
            "syncType": 1,
            "ttl": 7,
            "upstreamSettings": {
                "dynamicPartitionConfList": [],
                "dynamicPartitionMode": false,
                "partitionConfList": [],
                "uniqueIndexList": []
            },
            "writePartition": 0,
            "yarnName": "root.default_hrtech_da_pm"
        },
        "whereConf": {
            "nodeRowFilter": {},
            "requiredRowFilter": []
        }
    },
    "msg": "成功"
}

2.3 查看数据集基础信息

  • 权限需求

    资源

    权限

    数据集

    read

  • 接口描述与说明:获取数据集基础信息,可用于三方接入时粗略展示数据集的内容。

请求说明

  • 请求地址:{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/digest

请求示例

curl --location --request GET '{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/digest' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}'

请求参数

名称

类型

必选

示例值

描述

dataSetId

integer

123

数据集ID,获取方式见资源 ID 获取方式

folderPath

integer

0

是否需要完整的文件夹路径[0不需要;1需要]

返回参数

名称

类型

描述

id

integer

数据集ID

appID

integer

项目ID

appName

string

项目名称

detailUrl

string

数据集前端页面地址,可直接跳转

folderName

list

数据集文件夹路径 -> 根目录为默认值,代表该数据集没有存放在文件夹下
如入参folderPath=0,则下面json示例中folderName只为 "folderName": [ "子文件夹-层级3" ]
Image

name

string

数据集名称

ownerEmailPrefix

string

数据集拥有者

status

integer

数据集状态 -> 通常情况下status=0

type

integer

数据集类型[常见的几种:0: ClickHouse表作为数据源生成的数据集、2: Hive表作为数据源生成的数据集、8: 自定义SQL生成的数据集、10: MySQL表作为数据源生成的数据集、22: Prep类型的数据集]

{
    "code": "aeolus/ok",
    "data": {
        "appId": 7777947,
        "appName": "测试项目-名称",
        "demoUrl": "http://xxx.com",
        "descr": "这是一段描述,描述数据集的作用",
        "detailUrl": "https://aeolus-release.fedev.bytedanc*.net/aeolus#/dataManage/detail/{{dataSetId}}?appId=77*****",
        "folderName": [
            "子文件夹-层级3",
            "子文件夹-层级2",
            "子文件夹-层级1",
            "模板数据集",
            "根目录"
        ],
        "id": {{dataSetId}},
        "name": "测试open-api专用数据集1",
        "ownerEmailPrefix": "userEmailPrefix",
        "status": 0,
        "type": 22
    },
    "msg": "成功"
}

2.4 更新数据集基础信息

  • 权限需求

    资源

    权限

    数据集

    write

  • 接口描述与说明:对应前端数据集基础描述信息的更新。

注意:此接口允许更新的信息内容与接口查看数据集基础信息有差异。

Image

Image

请求说明

  • 请求地址:{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/digest
    注意:这里是全量覆盖更新,即如果需要更新某个属性,则还需要将其他各个属性的原始内容全量传入,不然则视为使用空白值覆盖原有属性。

请求示例

curl --location --request PUT '{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/digest' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}' \
--data-raw '{
    "dataSetName": "测试open-api专用数据集1",
    "dataSetDescr": "这是一段描述,描述数据集的作用"
}'

请求参数

参数

类型

必选

示例值

描述

dataSetId

integer

123

数据集ID,获取方式见资源 ID 获取方式

dataSetName

integer

数据集1

数据集名称

dataSetDescr

string

这是一段数据集描述

数据集描述

返回示例

{
    "code": "aeolus/ok",
    "data": {
        "affectedRows": 1
    },
    "msg": "成功"
}

2.5 设置数据集的标签

  • 权限需求

    资源

    权限

    数据集

    write

  • 接口描述与说明:设置数据集的标签信息,数据集标签本身附属于项目,需与「数据集标签-获取项目下数据集标签信息」接口配合使用
    Image

请求说明

  • 请求地址:{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/dataSetTag

请求示例

curl --location --request POST '{{domain}}/aeolus/api/v4/open/dataset/{{dataSetId}}/dataSetTag' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}' \
--data-raw '{
    "tagIdList": [
        153
    ]
}'

请求参数

名称

类型

必选

示例值

描述

dataSetId

integer

123

数据集ID,获取方式见资源 ID 获取方式

tagIdList

list < integer >

153

标签ID,一次可给数据集设置多个标签;前端表现为可勾选多个

返回示例

{
    "code": "aeolus/ok",
    "data": {},
    "msg": "成功"
}

2.6 获取项目下数据集文件夹列表

版本:V2.76.0 版本及以上

  • 权限需求

资源

权限

项目

read

请求说明

获取项目下文件夹list

  • 接口路径

    {{domain}}/aeolus/api/v4/open/app/{{appId}}/dataSetFolderTreeV2

请求示例

  • cURL示例
curl --location --request GET '{{domain}}/aeolus/api/v4/open/app/{{appId}}/dataSetFolderTreeV2' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer {{jwtToken}}'

请求参数

参数

类型

必选

示例值

描述

appId

integer

123

项目 ID,获取方式见资源 ID 获取方式

返回参数

名称

类型

描述

official

list

官方目录

private

list

个人目录

public

list

公共目录

appID

integer

项目ID

id

integer

数据集ID

belong

integer

1是公共数据集,2是个人数据集

ctime

datetime

数据集创建时间

deleteTime

datetime

数据集删除时间

mtime

datetime

数据集最后修改时间

descr

string

数据集描述

name

string

数据集名称

ownerEmailPrefix

string

数据集拥有者

status

integer

数据集文件夹状态,0是正常状态,1是彻底删除,2是回收站中

parentId

integer

数据集文件夹父文件夹,为 0 则代表没有父文件夹,已在根目录

childList

list

数据集文件夹子文件夹列表
Image

返回示例

{
    "code": "aeolus/ok",
    "data": {
        "official": [
            {
              "appId": 7*******,  #项目id
              "belong": 1,     #归属 1是公共,2是个人
              "ctime": "2024-05-30 11:57",
              "deleteTime": null,
              "descr": null,
              "id": 12107,
              "mtime": "2024-05-30 11:57",
              "name": "测试",
              "ownerEmailPrefix": "userEmailPrefix",
              "parentId": 12101,  #父目录id
              "status": 0,   
              "childList": [],   #子目录list
            }
        ],
        "private": [],
        "public": [],
    }
    "msg": "成功"
}