Python安装tesserocr遇到的坑

第一个坑:

使用 pip方法安装:pip install tesserocr 

结果会报错。原因是在windows上不兼容。所以千万不要使用这种方法。

正确的方式应该是wheel 安装。.whl文件地址如下,选择与你下载的 tesseract 相匹配的版本下载即可,比如我下载的tesseract 版本为4.0.0,就下载2.4.0版本的tesserocr .

https://github.com/simonflueckiger/tesserocr-windows_build/releases

好了下载完后,命令行运行:

pip3 install tesserocr-2.4.0-cp37-cp37m-win_amd64.whl

一定要把.whl文件放在用户文件夹下(像这样的:C:\Users\zw>),才可以安装成功,不然找不到文件。

第二个坑:

安装后进行测试:

image.png 大家可自行下载,地址是:https://raw.githubusercontent.com/Python3WebSpider/TestTess/master/image.png

Python安装tesserocr遇到的坑_第1张图片

运行后报错:

Traceback (most recent call last):
  File "C:/Users/zw/Desktop/myfirst.py", line 21, in
    print(tesserocr.image_to_text(image))
  File "tesserocr.pyx", line 2443, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\Users\zw\AppData\Local\Programs\Python\Python37\/tessdata/

Traceback 的大概意思是:无法初始化 API,tessdata 可能是一个无效的路径。

我想我知道问题所在了。

打开文件路径:C:\Program Files (x86)\Tesseract-OCR

会发现有个tessdata文件夹。

把这个文件夹复制到我的Python37文件夹下,再次运行测试代码

Python安装tesserocr遇到的坑_第2张图片

完美解决。。

你可能感兴趣的:(学习心得)