You need to enable JavaScript to run this app.
导航
GetEvaluationResult - 获取评测任务结果
最近更新时间:2024.05.15 23:03:49首次发布时间:2024.05.15 22:58:52

获取评测任务结果

请求参数

下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数

参数
类型
是否必填
示例值
描述
Action
String

GetEvaluationResult

要执行的操作,取值:GetEvaluationResult。

Version
String

2024-01-01

API的版本,取值:2024-01-01。

Id
String

-

模型评测结果的ID

返回参数

下表仅列出本接口特有的返回参数。更多信息请参见返回结构

参数
类型
示例值
描述
Id
String

-

模型评测结果的ID

EvaluationJobId
String

-

模型评测结果对应的模型评测任务的ID

DatasetType
String

-

模型评测结果对应的评测集种类

AdminEvaluationDatasetId
String

-

模型评测结果对应的预置评测集的ID

DatasetName
String

-

模型评测结果对应的评测集名称

DatasetDisplayName
String

-

模型评测结果对应的评测集展示名称

EvaluationAbility
String

-

模型评测结果对应的评测集的能力维度

ScoringWeight
Integer

-

模型评测结果的分数比重

DatasetTosLocation
TosLocation

-

用户自定义数据集的 TOS 地址

Method
String

-

评测算法

Metrics
EvaluationMetric

-

模型评测结果指标

TokenUsage
EvaluationTokenUsage

-

模型评测结果总 token 消耗量

SampleTosLocation
TosLocation

-

模型评测结果文件的 TOS 地址(最多 50 条样本)

CreateTime
String

-

模型评测结果创建时间,RFC3339格式

UpdateTime
String

-

模型评测结果更新时间,RFC3339格式

请求示例

{
    "Id": "er-20240326054800-shhvj"
}

返回示例

{
    "ResponseMetadata": {
        "RequestId": "202404111438083076CAB39885F31BD671",
        "Action": "GetEvaluationResult",
        "Version": "2024-01-01",
        "Service": "ark",
        "Region": "cn-beijing"
    },
    "Result": {
        "Id": "er-20240326054800-shhvj",
        "EvaluationJobId": "ej-20240326054800-gl9rp",
        "DatasetType": "AdminDataset",
        "AdminEvaluationDatasetId": "aed-20240227112053-bt425",
        "DatasetName": "ark-ff-mmlu-other-5shots",
        "DatasetDisplayName": "MMLU 其他学科",
        "EvaluationAbility": "MMLU",
        "ScoringWeight": 3107,
        "Method": "BuiltIn",
        "Metrics": null,
        "TokenUsage": {
            "TotalTokenCount": 0
        },
        "SamplesTosLocation": {
            "BucketName": "",
            "ObjectKey": ""
        },
        "CreateTime": "2024-03-26T05:48:00Z",
        "UpdateTime": "2024-03-26T05:48:00Z"
    }
}

错误码

您可访问公共错误码,获取更多错误码信息。