Mac系统下开发Python OCR程序时安装Tesseract-OCR失败求助
解决Python 2.7 + pytesseract OCR安装报错问题
看起来你踩了个新手常犯的小坑——你用pip install tesseract-ocr安装的并不是真正的Tesseract OCR核心引擎,而是一个老旧、维护停滞的Cython绑定包,它在编译阶段很容易卡住失败。咱们换个正确的思路来搞定:
正确的安装步骤
1. 先在系统层面安装Tesseract OCR引擎
pytesseract只是Python的调用封装工具,必须先有底层的OCR引擎才能工作:
- MacOS:用Homebrew一键安装
brew install tesseract - Linux(Debian/Ubuntu):
sudo apt-get install tesseract-ocr - Windows:从官方渠道下载安装包,安装时记得勾选"Add to PATH"选项,或者之后手动把安装路径添加到系统环境变量中
2. 安装Python的pytesseract库
这才是你真正需要的Python绑定工具:
pip install pytesseract
3. (可选)手动指定Tesseract路径
如果系统找不到Tesseract可执行文件,在代码里手动配置路径即可:
import pytesseract # 示例为Mac默认路径,根据你的实际安装位置调整 pytesseract.pytesseract.tesseract_cmd = '/usr/local/bin/tesseract'
测试验证
用这段简单代码确认是否正常工作:
from PIL import Image import pytesseract # 替换成你的测试图片路径 img = Image.open('test_img.png') extracted_text = pytesseract.image_to_string(img) print(extracted_text)
核心就是要区分开「系统层面的OCR引擎」和「Python的调用封装库」,这样就能避开之前的安装卡住问题啦~
内容的提问来源于stack exchange,提问作者Tobias Woods




