You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

Mac系统下开发Python OCR程序时安装Tesseract-OCR失败求助

解决Python 2.7 + pytesseract OCR安装报错问题

看起来你踩了个新手常犯的小坑——你用pip install tesseract-ocr安装的并不是真正的Tesseract OCR核心引擎,而是一个老旧、维护停滞的Cython绑定包,它在编译阶段很容易卡住失败。咱们换个正确的思路来搞定:

正确的安装步骤

1. 先在系统层面安装Tesseract OCR引擎

pytesseract只是Python的调用封装工具,必须先有底层的OCR引擎才能工作:

  • MacOS:用Homebrew一键安装
    brew install tesseract
    
  • Linux(Debian/Ubuntu)
    sudo apt-get install tesseract-ocr
    
  • Windows:从官方渠道下载安装包,安装时记得勾选"Add to PATH"选项,或者之后手动把安装路径添加到系统环境变量中

2. 安装Python的pytesseract

这才是你真正需要的Python绑定工具:

pip install pytesseract

3. (可选)手动指定Tesseract路径

如果系统找不到Tesseract可执行文件,在代码里手动配置路径即可:

import pytesseract
# 示例为Mac默认路径,根据你的实际安装位置调整
pytesseract.pytesseract.tesseract_cmd = '/usr/local/bin/tesseract'

测试验证

用这段简单代码确认是否正常工作:

from PIL import Image
import pytesseract

# 替换成你的测试图片路径
img = Image.open('test_img.png')
extracted_text = pytesseract.image_to_string(img)
print(extracted_text)

核心就是要区分开「系统层面的OCR引擎」和「Python的调用封装库」,这样就能避开之前的安装卡住问题啦~

内容的提问来源于stack exchange,提问作者Tobias Woods

火山引擎 最新活动