功能概述
图像处理算子支持识别图片中的文字信息,提供文字识别结果、语种等多种关键信息,为多语种场景下的图片文字识别、提取提供解决方案,本文为您介绍图像处理算子的相关操作。
操作步骤
第一步:新建图像OCR-Qwen算子
- 点击「数据接入」,选择「可视化知识处理」,点击「新建」,选择「新建离线任务」。

- 按照离线任务中的步骤完成离线任务创建,在处理节点时,选择为数据连接添加「图像处理」中的算子。

第二步:配置设置模型
点击「图像处理OCR-Qwen」,在基本信息页面,配置相关参数。

- 模型信息
参数 | 配置说明 |
|---|
模型调用地址 | 应用的调用地址 |
推理接入点 | 一般格式为ep-xxxxxxxxxx-yyyy,创建方式参考创建自定义推理接入点 |
API Key | 一般格式为xxxxxxxx-yyyy-xxxx-yyyy-xxxxxxxxxxxx,获取方式参考获取 API Key 并配置 |
- 处理配置
输入模式:选择输入数据的来源模式。
支持以下两种模式:
- url:输入在线文件的 URL。
- file:上传本地文件。
- 语言识别配置
下拉单选,支持搜索,根据技术选型选择可选的语言。目前支持中文和英文。
- 高级设置
相关参数说明如下:
并发大小 | 设置并发处理的任务数量。
默认值:10 |
|---|
超时时间 | 设置任务处理的超时时间,单位为毫秒(ms)。
默认值:180000 ms |
重试间隔 | 设置任务失败后的自动重试次数。
默认值:3 次 |
异常处理 | 配置当任务发生异常时的处理策略。
支持以下两种策略:
• 终止任务:当发生异常时,立即终止当前任务的执行。这是默认选项。
• 忽略异常:当发生异常时,忽略错误并继续执行任务的后续步骤。 |
- 输出配置
**输出字段:**指定用于存储识别结果的输出字段名称。用户自定义输出字段,不支持首位空格,其余均支持,不超过64个字符。
第三步:测试执行
点击「测试执行」,在「测试执行结果」栏中查看输出结果。
