Windows系统下如何用Python运行Tesseract OCR?已装包仍报错
解决Windows下Python运行Tesseract OCR的导入报错问题
看起来你在Windows环境用Python2.7运行Tesseract OCR时,遇到了import pytesseract的报错。结合你的代码和环境,我整理了几个关键的排查和解决步骤:
1. 先确认Tesseract OCR核心程序已安装
pytesseract只是Python的封装库,必须依赖Tesseract本体才能工作——你可能只装了Python包,没装核心的OCR程序:
- 下载兼容Python2.7的Tesseract旧版本(比如Tesseract 4.1.1,新版本不再支持Python2.x)
- 安装时一定要勾选「Add to PATH」选项,这样系统能自动找到
tesseract.exe;如果没勾选,手动把安装路径(默认是C:\Program Files\Tesseract-OCR)添加到系统环境变量的PATH中。
2. 给pytesseract指定Tesseract路径
即使PATH配置好了,有时候pytesseract还是找不到执行文件,直接在代码里手动指定最稳妥:
在import pytesseract之后添加这行代码(替换成你的实际安装路径):
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
3. 安装兼容Python2.7的pytesseract版本
新版本的pytesseract已经放弃了Python2.x支持,你需要安装旧版本才能兼容:
打开命令提示符,执行:
pip install pytesseract==0.3.7
这个版本是最后支持Python2.7的pytesseract版本。
4. 确认Pillow(PIL)已正确安装
你的代码里用了from PIL import Image,Python2.7下推荐安装Pillow(PIL的维护分支),执行:
pip install pillow
修改后的完整代码示例
把这些调整整合后,你的代码应该是这样的:
from PIL import Image import pytesseract # 手动指定Tesseract执行文件路径 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' im = Image.open("sample1.jpg") text = pytesseract.image_to_string(im, lang='eng') print(text)
额外排查点
如果还是报错,检查这两个细节:
- 确保
sample1.jpg和你的脚本在同一目录,或者用绝对路径(比如r'C:\Users\Usama Malik\Desktop\sample1.jpg') - 查看完整的报错信息,如果是缺少依赖库,根据提示安装对应的组件。
内容的提问来源于stack exchange,提问作者Usama Shaukat




