PDF 内容解析算子,支持对 PDF 文件进行视觉模型解析与 Markdown 结构化输出。
LAS 为您提供了算子在线体验能力,您可以在页面最下方快速体验算子能力。
调用 PDF 文档解析(豆包) 进行 PDF 内容解析,支持对公网、火山内网或 TOS PDF 源文件进行视觉模型解析,得到 Markdown 或结构化输出。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
operator_id | string | 是 | las_pdf_parse_doubao | 算子 ID |
operator_version | string | 是 | v1 | 算子版本 |
data | PdfParseUserReqParams | 是 | PDF 解析请求参数 |
参数 | 类型 | 示例值 | 说明 |
|---|---|---|---|
metadata | metadata | 请求元信息 |
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/submit" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_pdf_parse_doubao", "operator_version": "v1", "data": { "url": "https://las-ai-cn-beijing-baseline.tos-cn-beijing.volces.com/operator_cards_serving/public/baseline/las_pdf_parse_doubao/v1/pdf-sample.pdf" } }'
{ "metadata": { "task_id": "task-20251125163544-abc123", "task_status": "PENDING", "business_code": "200", "error_msg": "" } }
查询 PDF 解析任务的执行状态和结果。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
operator_id | string | 是 | las_pdf_parse_doubao | 算子 ID |
operator_version | string | 是 | v1 | 算子版本 |
task_id | string | 是 | task-xxx | 任务 ID |
参数 | 类型 | 示例值 | 说明 |
|---|---|---|---|
metadata | metadata | 请求元信息 | |
data | PdfParseResponse | 返回的数据 |
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/poll" \ --header "Content-Type: application/json" \ --header "Authorization: Bearer $LAS_API_KEY" \ --data '{ "operator_id": "las_pdf_parse_doubao", "operator_version": "v1", "task_id": "task-20251125163544-abc123" }'
{ "metadata": { "task_id": "task-20251125163544-abc123", "task_status": "COMPLETED", "business_code": "200", "error_msg": "" }, "data": { "markdown": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "detail": [ { "page_id": 1, "page_md": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "page_image_hw": { "h": 3508, "w": 2480 }, "text_blocks": [ { "text": "我的小狗 \n我家有一只可爱的小狗,它的名字叫小白。小白是一只白色的泰迪犬,它有一双圆圆的大眼睛,像两 颗黑珍珠一样闪闪发光...", "label": "text", "box": { "x0": 100, "y0": 200, "x1": 400, "y1": 650 }, "norm_box": [ 0.1, 0.2, 0.4, 0.65 ] } ] } ] } }