支持对PDF文件进行识别,输出结构化信息。同时支持doc/docx文件类型。
名称 | 内容 |
---|---|
图片要求 | 1. 文件格式:pdf/doc/docx。 2. 文件大小: a.要求Base64编码和urlencode之后不超过 8 MB。 b.如果传PDF完整URL,URL对应文件大小建议不要超过8MB。 3. 输入文件过大时,返回的HttpCode如下:400/413/502。 |
名称 | 内容 |
---|---|
接口地址 | https://visual.volcengineapi.com |
请求方式 | POST |
Content-Type | application/x-www-form-urlencoded |
是否需要鉴权 | 是 |
以下请求参数列表仅列出了接口请求参数和必要公共参数,完整公共参数列表见 公共参数。
名称 | 类型 | 是否必填 | 描述 |
---|---|---|---|
X-Date | String | 是 | 使用UTC时间,精确到秒。请使用格式:YYYYMMDD'T'HHMMSS'Z' ,例如:20201103T104027Z |
Authorization | String | 是 | HMAC-SHA256:签名方法 |
X-Security-Token | String | 否 | 指安全令牌服务(Security Token Service,STS) 颁发的临时安全凭证中的SessionToken,使用长期密钥时无需填写该参数。 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取值:OCRPdf |
Version | 必选 | String | 版本号,取值:2021-08-23 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
image_base64 | 与image_url二选一 | String | 文件的base64编码 注意: 只需要传文件的base64值 |
image_url | 与image_base64二选一 | String | 图片/PDF文件的URL链接 注意: 要求image_base64与image_url二选一,如果2个字段都有,优先解析image_base64。 |
file_type | 可选 | String | 文件类型:"pdf"/"doc", 默认为"pdf" |
请参考通用返回字段及错误码 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
page_infos | Array of page_info | 页面信息 | 字段说明见下方 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
poly | Array of Points | 行矩形框信息(可能有倾斜矩形) | 四个点的坐标,[左上, 右上, 右下, 左下] |
text | Array of String | 识别结果 | 文本识别结果 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
x | float | 坐标点横坐标占尺寸的百分比 | |
y | float | 坐标点纵坐标占尺寸的百分比 |
{ "code":10000, "data":{ "page_infos":[ { "poly": [ [0.408198, 0.105675], [0.589619, 0.105675], [0.589619, 0.127048], [0.408198, 0.127048] ] "text": [ "咨询服务合同" ] } ] }, "message":"Success", "request_id":"021629427766315fdbddc01010500400000000000000068da22fd", "time_elapsed":"5.330714543s" }
请参考通用返回字段及错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
401 | 50205 | "Image Size Exceeds Maximum Limit: please compress the image" | 文件大小超过上限 |
400 | 50207 | "Image Decode Error: image format unsupported" | 文件解码错误,文件内容为空或格式错误 |
401 | 50400 | "Access denied due to invalid authentication information" | 鉴权失败 |
404 | 50402 | "Invalid Request URL" | 无效的请求路径 |
500 | 50500 | "Internal Error: please contact with bytedance engineering team" | 内部错误,需要联系开发人员 |