You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

Windows系统下如何用Python运行Tesseract OCR?已装包仍报错

解决Windows下Python运行Tesseract OCR的导入报错问题

看起来你在Windows环境用Python2.7运行Tesseract OCR时,遇到了import pytesseract的报错。结合你的代码和环境,我整理了几个关键的排查和解决步骤:

1. 先确认Tesseract OCR核心程序已安装

pytesseract只是Python的封装库,必须依赖Tesseract本体才能工作——你可能只装了Python包,没装核心的OCR程序:

  • 下载兼容Python2.7的Tesseract旧版本(比如Tesseract 4.1.1,新版本不再支持Python2.x)
  • 安装时一定要勾选「Add to PATH」选项,这样系统能自动找到tesseract.exe;如果没勾选,手动把安装路径(默认是C:\Program Files\Tesseract-OCR)添加到系统环境变量的PATH中。

2. 给pytesseract指定Tesseract路径

即使PATH配置好了,有时候pytesseract还是找不到执行文件,直接在代码里手动指定最稳妥:
import pytesseract之后添加这行代码(替换成你的实际安装路径):

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

3. 安装兼容Python2.7的pytesseract版本

新版本的pytesseract已经放弃了Python2.x支持,你需要安装旧版本才能兼容:
打开命令提示符,执行:

pip install pytesseract==0.3.7

这个版本是最后支持Python2.7的pytesseract版本。

4. 确认Pillow(PIL)已正确安装

你的代码里用了from PIL import Image,Python2.7下推荐安装Pillow(PIL的维护分支),执行:

pip install pillow

修改后的完整代码示例

把这些调整整合后,你的代码应该是这样的:

from PIL import Image
import pytesseract

# 手动指定Tesseract执行文件路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

im = Image.open("sample1.jpg")
text = pytesseract.image_to_string(im, lang='eng')
print(text)

额外排查点

如果还是报错,检查这两个细节:

  • 确保sample1.jpg和你的脚本在同一目录,或者用绝对路径(比如r'C:\Users\Usama Malik\Desktop\sample1.jpg'
  • 查看完整的报错信息,如果是缺少依赖库,根据提示安装对应的组件。

内容的提问来源于stack exchange,提问作者Usama Shaukat

火山引擎 最新活动