PDF 内容解析算子,支持对 PDF 文件进行视觉模型解析与 Markdown 结构化输出。
LAS 为您提供了算子在线体验能力,您可以在页面最下方快速体验算子能力。
调用 PDF 文档解析(豆包) 进行 PDF 内容解析,支持对公网、火山内网或 TOS PDF 源文件进行视觉模型解析,得到 Markdown 或结构化输出。
参数 | 类型 | 必填 | 示例值 | 说明 | |
|---|---|---|---|---|---|
operator_id | string | 是 | las_pdf_parse_doubao | 算子 ID | |
operator_version | string | 是 | v1 | 算子版本 | |
data | PdfParseUserReqParams | 是 | PDF 解析请求参数 | ||
url | string | 是 | https://example.com/file.pdf | PDF 文件的可下载地址。支持 http/https、火山 TOS(tos://bucket/key)。 | |
start_page | integer | 否 | 1 | 起始页(1 为第一页)。缺省值 1。 | |
num_pages | integer | 否 | 解析的页数。未设置则从 start_page 到文档末尾,最多支持 200 页。 | ||
parse_mode | string | 否 | normal | 文档解析功能基于视觉理解大模型,能够对多语言、复杂版面、复杂公式、复杂表格以及页面模糊等多种场景下的文档实现高质量解析。解析模式分为 normal 和 detail 两种:
| |
参数 | 类型 | 示例值 | 说明 | |
|---|---|---|---|---|
metadata | metadata | 请求元信息 | ||
task_id | string | task-xxx | 异步模式下的任务 ID,用于作业状态查询。 | |
task_status | string | PENDING | 异步模式下的任务状态。 任务状态。
| |
business_code | string | 业务码。 | ||
error_msg | string | 如有异常,会返回详细的异常信息。 | ||
curl --location "https://sd2a6d3q80c6ft26s2tv0.apigateway-cn-beijing.volceapi.com/api/v1/submit" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_pdf_parse_doubao", "operator_version": "v1", "data": { "url": "https://las-ai-cn-beijing-baseline.tos-cn-beijing.volces.com/operator_cards_serving/public/baseline/las_pdf_parse_doubao/v1/pdf-sample.pdf" } }'
{ "metadata": { "task_id": "task-20251125163544-abc123", "task_status": "PENDING", "business_code": "200", "error_msg": "" } }
查询 PDF 解析任务的执行状态和结果。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
operator_id | string | 是 | las_pdf_parse_doubao | 算子 ID |
operator_version | string | 是 | v1 | 算子版本 |
task_id | string | 是 | task-xxx | 任务 ID |
参数 | 类型 | 示例值 | 说明 | |||
|---|---|---|---|---|---|---|
metadata | metadata | 请求元信息 | ||||
task_id | string | task-xxx | 异步模式下的任务 ID。 | |||
task_status | string | COMPLETED | 异步模式下的任务状态。
| |||
business_code | string | 200 | 业务码。 | |||
error_msg | string | 如有异常,会返回详细的异常信息。 | ||||
data | PdfParseResponse | 返回的数据 | ||||
markdown | string | 所有页面的最终 Markdown 合并内容(final.md 汇总)。 | ||||
detail | list of page_detail | 逐页解析详情,含页面 Markdown、尺寸信息与结构化文本块。 | ||||
page_id | integer | 1 | 页编号(1 开始)。 | |||
page_md | string | 当前页的最终 Markdown(包含 bbox->图片替换)。 | ||||
page_image_hw | object | {"h":3508,"w":2480} | 页渲染图片的高度与宽度(像素)。 | |||
text_blocks | list of text_block | 文本块序列(按阅读顺序,包含图片占位的结构化信息)。 | ||||
text | string | "这是正文的第一段。" | 文本内容(当 label 为 text 时)。 | |||
label | string | "text" 或 "image" | 块类型。 | |||
box | object | {"x0":100,"y0":200,"x1":400,"y1":650} | 来自的坐标(以 0..1000 的归一化坐标按页宽高等比映射)。 | |||
norm_box | list of float | [0.1,0.2,0.4,0.65] | 归一化 bbox(如有)。 | |||
url | string | 图片裁剪的预签名 URL(有效期为 60 min)。 | ||||
error | string | 当发生异常时返回错误信息。 | ||||
curl --location "https://sd2a6d3q80c6ft26s2tv0.apigateway-cn-beijing.volceapi.com/api/v1/poll" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_pdf_parse_doubao", "operator_version": "v1", "task_id": "task-20251125163544-abc123" }'
{ "metadata": { "task_id": "task-20251125163544-abc123", "task_status": "COMPLETED", "business_code": "200", "error_msg": "" }, "data": { "markdown": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "detail": [ { "page_id": 1, "page_md": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "page_image_hw": { "h": 3508, "w": 2480 }, "text_blocks": [ { "text": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "label": "text", "box": { "x0": 100, "y0": 200, "x1": 400, "y1": 650 }, "norm_box": [ 0.1, 0.2, 0.4, 0.65 ] } ] } ] } }