/api/knowledge/service/rerank 接口用于重新批量计算输入文本与检索到的文本之间的 score 值,以对召回结果进行重排序。判断依据 chunk content 能回答 query 提问的概率,分数越高即模型认为该文本片能回答 query 提问的概率越大。
说明
URI | /api/knowledge/service/rerank | 统一资源标识符 |
|---|---|---|
方法 | POST | 客户端对向量数据库服务器请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
|---|---|---|---|---|
datas | list[map] | 是 | -- | 待重排的数据列表
|
rerank_model | string | 否 | "base-multilingual-rerank" | rerank 模型
|
rerank_instruction | string | 否 | -- | 重排指令 |
字段 | 类型 | 子字段 | 子字段类型 | 说明 |
|---|---|---|---|---|
code | integer | -- | -- | 状态码 |
message | string | -- | -- | 错误信息 |
request_id | string | -- | -- | 请求的唯一标识符 |
data | object | scores | array | float64 数组,与输入 datas 数组一一对应,表示每个文档与 query 的相关性得分 |
token_usage | integer | 本次 rerank 调用消耗的总 token 数量 |
状态码 | http 状态码 | 返回信息 | 状态码说明 |
|---|---|---|---|
0 | 200 | success | 成功 |
1000001 | 403 | VolcanoErrUnauthorized | 鉴权失败 |
1000002 | 400 | VolcanoErrInvalidRequest | 请求参数无效(当 query 缺失,或 datas 中所有文档都未提供任一媒体/文本内容时触发) |
300004 | 429 | VolcanoErrQuotaLimiter | 账户的 rerank 调用已达到配额限制 |
1000028 | 500 | VolcanoErrInternal | 服务内部错误,rerank模型过载 |
curl --location --request POST 'http://<your-host>/api/knowledge/service/rerank' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer <your-auth-token>' \ --data-raw '{ "rerank_model": "doubao-seed-rerank", "datas": [ { "query": "展示一张系统架构图", "title": "系统架构设计文档", "image": "https://<your-domaisn>/path/to/arch-diagram.png" }, { "query": "展示一张系统架构图", "title": "会议纪要", "content": "讨论了下个季度的 OKR。" } ] }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 43 Content-Type: application/json { "message":"success", "code":0, "request_id":"02170427320284800000000000000000000ffff0a0060861f847c", "data":[0.17574862881497047,0.7583029228400268] }
执行失败返回:
HTTP/1.1 403 OK Content-Length: 43 Content-Type: application/json { "message":"check sign error, please check your ak, sk", "code":1000001, "request_id":"02170427372421200000000000000000000ffff0a006086784460" }