You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

化学结构式图像的图像预处理和OCR

  1. 图像预处理部分:

    (1) 图像变换

     针对光照不均和角度倾斜造成的影响,可以采取以下方法:
    
         * 对图像进行灰度化或二值化处理,去除图片中的颜色信息;
    
         * 对图像进行旋转、翻转等变换,使图像倾斜角度减少或者消除。
    

    (2) 图像滤波

     使用滤波器进行图像平滑处理,去除图像噪声。可以采用中值滤波器,均值滤波器等滤波器。
    

    (3) ROI提取

     根据化学结构式的特殊结构,可以通过一些模式识别技术,如边缘检测算法,区域生长算法,直线检测等方法,对结构式的ROI(即区域)进行定位。
    
  2. OCR部分

    (1) 图像切割与区域处理

     根据ROI的定位结果,将结构式分成若干部分子图,以便进行单字符或单词的精确识别。具体的方法可以采用轮廓检测,二值化处理等方法。
    

    (2) 字符识别

     对单字符采用OCR(Optical Character Recognition)技术进行识别。OCR技术包括两种常用的方法:基于模板匹配的OCR方法和基于训练模型的OCR方法,前者适用于字符比较规则的情况,而后者适用于字符比较复杂的情况。
    

示例代码:

下面是Python中使用OpenCV和Tesseract进行化学结构式图像OCR的基本流程:

import cv2
import pytesseract

def chemical_formula_OCR(img_file):
    # 1. 读入图像
    img = cv2.imread(img_file)
    
    # 2. 图像预处理,包括灰度化、二值化、旋转等
    # 具体的预处理方法见上述各种技巧,此处略去
    
    # 3
本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。
展开更多
面向开发者的云福利中心,ECS 60元/年,域名1元起,助力开发者快速在云上构建可靠应用

社区干货

企业级智能OCR平台助力票据电子化|社区征文

当前基于OCR技术的文本识别,是票据电子化的技术基础与核心,但传统的OCR识别算法主要采用的是图像处理+统计学习的方法,存在很大局限性,只能对比较规范、清晰的印刷文字进行识别,而对于手写字符、文字不是很规整的内... 自研了具有完全知识产权的基于深度学习的企业级智能OCR平台。## 2. 解决方案我司的企业级智能OCR平台的整个架构均为自主研发。针对业务部门提出的多种OCR需求,如下图1所示,我司以所在企业内部的图片、PDF文件、视...

CogAgent:带 Agent 能力的视觉模型,免费商用

可接受1120×1120的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent等多种能力,在9个经典的图像理解榜单上(含VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE等)取得了通用能力第一的成绩,并在涵盖电脑、... CogAgent模型同时接受当前GUI截图(图像形式)和用户操作目标(文本形式,例如“search for the best paper in CVPR 2023”)作为输入,就能预测详细的动作,和对应操作元素的位置坐标。 **二、模型结构** ...

CogAgent:带 Agent 能力的视觉模型,免费商用

可接受1120×1120的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent等多种能力,在9个经典的图像理解榜单上(含VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE等)取得了通用能力第一的成绩,并在涵盖电脑、... CogAgent模型同时接受当前GUI截图(图像形式)和用户操作目标(文本形式,例如“search for the best paper in CVPR 2023”)作为输入,就能预测详细的动作,和对应操作元素的位置坐标。 ## 二、模型结构 CogAgent的...

集简云3月更新合集:新增33款集成应用,更新10款应用

◉ 新增应用:腾讯图像分析◉ 新增应用:腾讯人体识别◉ 新增应用:腾讯OCR◉ 新增应用:Coda◉ 新增应用:天行数据◉ 新增应用:得物◉ 新增应用:百家云 ◉ 新增应用:晓多机器人... 新应用:阿里OCR◉ 更新应用:微信小商店◉ 更新应用:用友**YonSuite**◉ 更新应用:循环执行 01**唯...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

化学结构式图像的图像预处理和OCR -优选内容

企业级智能OCR平台助力票据电子化|社区征文
当前基于OCR技术的文本识别,是票据电子化的技术基础与核心,但传统的OCR识别算法主要采用的是图像处理+统计学习的方法,存在很大局限性,只能对比较规范、清晰的印刷文字进行识别,而对于手写字符、文字不是很规整的内... 自研了具有完全知识产权的基于深度学习的企业级智能OCR平台。## 2. 解决方案我司的企业级智能OCR平台的整个架构均为自主研发。针对业务部门提出的多种OCR需求,如下图1所示,我司以所在企业内部的图片、PDF文件、视...
文字识别 OCR
图像文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,根据客户的业务场景和需求,支持通用印刷体文字识别、营业执照识别场景,为您提供图片内文字框坐标和(简体中文/英文)文字内容,提高您信息处理效率。您可进入文字识别 OCR体验产品功能。 应用场景资质审查,适用于银行、信贷、零售、电商等行业实现对企业营业执照、商标注册证等资产类证件结构识别和资质核验,可节省人力资源,提高审核效率有效降低业务风险。 内容审核与管理...
功能发布历史
图片处理配置 新增: 自适应旋转:支持对特定原图格式实现自动旋转至正确方向显示。 保留 EXIF 信息:支持对指定输出格式图像保留处理后的全部或部分 EXIF 信息。 2023-09-08 图片处理配置 自定义处理样式 新增:... 同时也支持开发者自行根据目录结构进行精简使用。 2023-08-18 第三方工具与社区插件 图片处理配置 新增:支持通过在模板开启处理结果持久化来永久保存处理结果。 优化:支持在原图格式为 jpeg 时,指定压缩质量参数为...
CogAgent:带 Agent 能力的视觉模型,免费商用
可接受1120×1120的高分辨率图像输入,具备视觉问答、视觉定位(Grounding)、GUI Agent等多种能力,在9个经典的图像理解榜单上(含VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE等)取得了通用能力第一的成绩,并在涵盖电脑、... CogAgent模型同时接受当前GUI截图(图像形式)和用户操作目标(文本形式,例如“search for the best paper in CVPR 2023”)作为输入,就能预测详细的动作,和对应操作元素的位置坐标。 **二、模型结构** ...

化学结构式图像的图像预处理和OCR -相关内容

集简云3月更新合集:新增33款集成应用,更新10款应用

◉ 新增应用:腾讯图像分析◉ 新增应用:腾讯人体识别◉ 新增应用:腾讯OCR◉ 新增应用:Coda◉ 新增应用:天行数据◉ 新增应用:得物◉ 新增应用:百家云 ◉ 新增应用:晓多机器人... 新应用:阿里OCR◉ 更新应用:微信小商店◉ 更新应用:用友**YonSuite**◉ 更新应用:循环执行 01**唯...

集简云本周更新:新增集成应用巨量千川、八爪鱼采集器、阿里AI、Coda等9款应用;更新钉钉等4款应用

◉ 新增应用:腾讯图像分析◉ 新增应用:腾讯人体识别◉ 新增应用:腾讯OCR◉ 新增应用:Coda◉ 新增应用:天行数据◉ 新增应用:得物◉ 更新应用:阿里OCR◉ 更新应用:钉钉第三方应用◉ 更新应用... 提供综合性的图像智能服务,包含图像理解(解析图像中的场景、物品、人物、动物等)、图像处理(对图像进行裁剪、美化)、图像质量评估(分析图像视觉质量)、图像搜索(在指定图库中搜索出相同或相似的图片)等。 ...

对大模型和AI的认识与思考|社区征文

声称性能超越GPT-4和人类专家,从宣传视频上看,Gemini已经具备人类的视觉(图像识别),听觉(语音识别)和自然语言理解的基本技能。我们一起来回顾下生成式AI的发展。### 2.1 GPT的发展如果说大语言模型存在一个分水岭的话,我觉得是2017年Google提出了一种全新的模型Transformer,Transformer是典型的encoder-decoder结构,最早是用来做机器翻译的。Transformer中最重要的结构是Multi-Head的Self-Attention机制。在Transformer之前...

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

「火山引擎」数智平台 VeDI 数据中台产品季刊 VOL.10

使用DataSail对订单交易系统中的MySQL增量数据做预处理,以实时方式同步到EMR StarRocks引擎,使用EMR StarRocks SQL任务实现多维、实时、高并发的OLAP数据分析。 [了解更多>>](https://www.volcengine.com/docs... 向量是一种常见的非结构化数据表现形式。基于向量相似度的 KNN 计算广泛使用于图像搜索、多模态搜索、推荐、大模型推理等场景。ByteHouse 企业版已提供向量数据的管理与近似度查询功能,同时通过支持多种常见近近似...

字节跳动湖平台在批计算和特征场景的实践

Orc、Avro 等文件格式进行存储。#### **Iceberg 特点*** SchemaEvolution:Iceberg 表结构的更新,本质是内在元信息的更新,因此无需进行数据迁移或数据重写。Iceberg 保证模式的演化( Schema Evolution )是个... 使用 Global Lake Service 给业务方提供简单易用的 UI 和访问控制等功能;* 在框架层,使用 Spark 作为特征处理框架(包含预处理和特征调研等),使用字节自研的 Primus 分布式框架作为训练框架,使用 Flink 实现流式训...

API 发布历史

以及算法模型新增adapt模型 添加盲水印 2023-12-14 GetSyncAuditResult 新增接口 同步审核图片 2023-12-12 CreateImageService 新增请求参数ResourceTags 创建服务 GetImageService 新增返回参数ResourceTags 获取... 图片去重获取结果值 2022 年 9 月发布时间 API 说明 相关文档 2022-09-26 GetImageSmartCropResult 新增接口 使用智能裁剪获取结果图 2022-09-19 图片编辑数据结构 补充各图片处理功能模板参数 图片编辑数据结构 ...

中原银行小微流水智能分析探索与实践|社区征文

中原银行数据智能团队2022年展开了小微流水智能分析的探索与应用,针对中小微企业、个体工商户、个人客户,开发完成了支持多种流水来源(如行内存量流水、他行流水、微信\支付宝流水),多种流水格式(图片、pdf扫描件、... 利用OCR识别技术,将pdf影印、照片等图像格式的流水文件解析成标准的Excel版本;将不同银行的Excel版本流水进一步标准化,识别出流水数据中交易双方名称、汇款备注等关键要素。- **流水业务语义识别**利用NLP语...

图片编辑数据结构

基础功能操作 操作名称 参数名称 参数类型 是否必填 参数描述 亮度 bright bright Float 是 调整图片亮度,取值范围为[-100, 100]。 对比度 contrast contrast Float 是 调整图片对比度,取值范围为[-100, 100]。 负片 invert - - - 指定时即可使用负片效果,其效果暂不支持更改配置。 锐化 sharpen sharpen Float 是 锐化图片,取值范围为[0,100]。 高斯模糊 blur sigma Float 是 高斯模糊图片,取值 > 0,值越大图像越模糊。 旋转...

高效视频处理框架 BMF 实践|社区征文

在MAC下涉及音视频处理用到的主要工具:1. 音视频播放:VLC、FFPLAY2. 音视频采集:OBS3. 音视频编解码处理:FFMPEG、OpenCV4. 音频处理:Audition5. OCR:Mac自带其他AI相关的音视频处理,比如图像识别,语音转文本... 实践了解码和合成功能。## 1、环境搭建日常工作使用的是Inter芯片的Mac本,基于docker环境搭建了bmf环境。bmf提供的docker镜像基于ubuntu 20.04,它包含了运行BMF CPU和GPU的完整环境依赖:Cuda11.8, Pytorch 2....

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

一图详解大模型
浓缩大模型架构,厘清生产和应用链路关系
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询