/api/knowledge/doc/info 接口用于查看知识库或某个实验版本下的文档信息
支持通过指定 pipeline_name 参数,来实现查看某个实验版本下的文档状态
完成“签名鉴权方式“页面的注册账号、实名认证、AK/SK 密钥获取和签名获取后,可调用 API 接口实现查看知识库下的某个文档的信息的功能。
URI | /api/knowledge/doc/info | 统一资源标识符 |
|---|---|---|
请求方法 | POST | 客户端对向量数据库服务器请求的操作类型 |
请求头 | Content-Type: application/json | 请求消息类型 |
Authorization: HMAC-SHA256 *** | 鉴权 |
参数 | 类型 | 是否必选 | 默认值 | 参数说明 |
|---|---|---|---|---|
collection_name | string | 否 | -- | 知识库名称 |
project | string | 否 | default | 知识库所属项目,获取方式参见文档API 接入与技术支持 注意 若不指定该字段,则在default项目下创建。 |
resource_id | string | 否 | -- | 知识库唯一 id |
doc_id | string | 是 | -- | 要查询的文档 id |
return_token_usage | bool | 否 | false | 是否返回文档向量化和文档生成摘要所消耗的 tokens |
pipeline_name | string | 否 | -- | 实验版本名称
|
参数 | 参数说明 |
|---|---|
code | 状态码 |
message | 返回信息 |
request_id | 标识每个请求的唯一标识符 |
data | 文档信息 |
data 返回值
字段 | 子字段 | 字段类型 | 说明 |
|---|---|---|---|
collection_name | -- | string | 知识库名称 |
doc_name | -- | string | 文档名称 |
doc_hash | -- | string | 文档内容的唯一 hash 值 |
doc_id | -- | string | 文档唯一标识 |
add_type | -- | string | 文档导入方式 |
doc_type | -- | string | 文档类型 |
create_time | -- | number | 文档创建时间,毫秒级时间戳 |
added_by | -- | string | 文档上传人 |
update_time | -- | number | 文档更新时间,毫秒级时间戳 |
url | -- | string | 文档的 URL 地址 |
meta | -- | string | 文档元信息,JSON 字符串格式 |
point_num | -- | number | 文档切片数量 |
status | object | 文档处理状态对象 | |
process_status | number | 文档处理状态 | |
doc_summary | -- | string | 文档全文摘要 |
brief_summary | -- | string | 文档精简摘要 |
title | -- | string | 文档或视频标题 |
video_outline | object | 视频大纲信息(音视频知识库且 enable_smart_summary=true 时返回) | |
title | string | 视频大纲标题 | |
summary | string | 视频整体摘要 | |
chapters | array | 视频章节列表,单个元素结构如下:
| |
video_frame | string | 视频关键帧路径 | |
video_frame | -- | string | 视频封面或关键帧访问 URL 地址 |
audio_outline | object | 音频大纲信息(仅在音视频知识库且 enable_audio_smart_summary=true 时返回) | |
title | string | 音频大纲标题 | |
summary | string | 音频整体摘要说明 | |
chapters | array | 音频章节列表,单个元素结构如下:
| |
doc_size | -- | number | 文档大小(字节) |
full_directory_path | -- | array | 文档所在目录路径 |
is_wiki | -- | boolean | 是否为 wiki 类型文档 |
statistics | object | 文档统计信息对象 | |
pages | number | 页数 | |
lines | number | 行数 | |
cells | number | 单元格数量 | |
chars | number | 提取文本字符数 | |
images | number | 图片数量 | |
tables | number | 表格数量 |
failed_code | 错误描述 | 处理建议 |
|---|---|---|
10001 | 文档下载超时 | 请上传重试。如果问题仍然存在,请联系我们 |
10003 | url 校验失败,请确认 url 链接 | 请确认 url 链接正确后重试。如果问题仍然存在,请联系我们 |
10005 | 飞书文档获取异常,请确认有效且授权 | 请确认飞书文档权限问题,通过飞书开放平台 OpenAPI 飞书开放平台确认权限 |
30001 | 超过知识库文件限制大小 | 超过知识库配额限制。配额说明参考 |
35001 | 超过知识库切片数量限制 | 超过知识库配额限制。配额说明参考 |
35002 | FAQ 文档解析为空 | FAQ 文档解析结果为空,切片数为 0。请确保文档中包含有效数据 |
35004 | 超过知识库 FAQ 文档 sheet 数量限制 | 超过知识库配额限制。配额说明参考 |
36003 | 结构化文档表头不匹配 | 结构化文档表头不匹配,请确保上传文档中每个 sheet 的表头与预定义的知识库表结构完全一致 |
36004 | 结构化文档数据类型转换失败 | 结构化文档数据类型转换失败,请确保上传文档中每个 sheet 的单元格的内容格式与预定义的知识库表结构数据类型完全一致 |
36005 | 超过知识库结构化文档 sheet 数量限制 | 超过知识库配额限制。配额说明参考 |
36006 | 超过知识库结构化文档有效行数限制 | 超过知识库配额限制。配额说明参考 |
36007 | 结构化文档解析为空 | 结构化文档解析结果为空,切片数为 0。请确保文档中包含有效数据 |
36008 | 做embedding的列组合长度超出限制 | 缩短做embedding列的文本长度 |
其他错误码 | 未知错误,请联系我们 | 未知错误,请联系我们 |
状态码 | http状态码 | 返回信息 | 状态码说明 |
|---|---|---|---|
0 | 200 | success | 成功 |
1000001 | 401 | unauthorized | 鉴权失败 |
1000002 | 403 | no permission | 权限不足 |
1000003 | 400 | invalid request:%s | 非法参数 |
1000005 | 400 | collection not exist | collection不存在 |
1001001 | 400 | doc not exist | doc不存在 |
curl -i -X POST \ -H 'Content-Type: application/json' \ -H 'Authorization: HMAC-SHA256 ***' \ https://api-knowledgebase.mlp.cn-beijing.volces.com/api/knowledge/doc/info \ -d '{ "collection_name": "test_collection_name", "project": "", "doc_id": "test123", "return_token_usage": true }'
执行成功返回:
HTTP/1.1 200 OK Content-Length: 43 Content-Type: application/json { "collection_name": "video_collection", "doc_name": "会议视频.mp4", "doc_hash": "xxxxxxxxxxxxxxxx", "doc_id": "_sys_auto_gen_doc_id-xxxx", "add_type": "tos_fe", "doc_type": "mp4", "create_time": 1768804541257, "added_by": "user@example.com", "update_time": 1768804640273, "meta": "[]", "point_num": 11, "status": { "process_status": 0 }, "doc_summary": "", "brief_summary": "", "title": "项目交付与竞品分析会议", "video_outline": { "title": "项目交付与竞品分析会议大纲", "summary": "会议围绕项目进度、重点事项以及竞品分析方式展开。", "chapters": [ { "title": "项目交付计划与重点事项", "content": "讨论项目时间节点与需要优先推进的关键事项。", "start_time": 0, "end_time": 76000, "element_content": [ "说话人1: 讨论项目整体时间安排。[00:00:00]", "说话人1: 确认需要优先处理的事项。[00:00:09]", "说话人2: 补充相关技术方向建议。[00:00:19]" ] }, { "title": "公司复盘与阶段总结", "content": "回顾阶段性成果,并讨论改进方向。", "start_time": 76000, "end_time": 169000, "element_content": [ "说话人1: 提出阶段复盘的必要性。[00:01:23]", "说话人1: 讨论如何系统总结经验。[00:02:23]" ] }, { "title": "分阶段竞品分析策略", "content": "明确不同阶段的竞品范围与分析重点。", "start_time": 169000, "end_time": 317000, "element_content": [ "说话人2: 说明竞品需按阶段区分。[00:03:00]", "说话人1: 当前阶段聚焦核心竞品。[00:04:31]", "说话人2: 提出补充竞品条目的建议。[00:05:01]" ] } ], "video_frame": "USER_VIDEO/xxx/fragment_0_frame_1.jpg" }, "video_frame": "xxx", "doc_size": 29964057, "full_directory_path": [], "is_wiki": false, "statistics": { "pages": 0, "lines": 0, "cells": 0, "chars": 6127, "images": 0, "tables": 0 } }
执行失败返回:
HTTP/1.1 400 OK Content-Length: 43 Content-Type: application/json {"code":1000003, "message":"invalid request:%s", "request_id": "021695029757920fd001de6666600000000000000000002569b8f"}