下载和使用pytesseract(血泪史啊,坑!)

tesseract是python的一个OCR识别库

在使用pytesseract之前我们需要去下载tesseract
下载地址:
https://digi.bib.uni-mannheim.de/tesseract/
过程可能会相当的慢。

下载完成后要将Tesseract-OCR文件夹中的tessdata文件夹添加到系统环境变量当中。

重点

Snipaste_2020-08-19_15-06-00.jpg
像上述一样
变量名:TESSDATA_PREFIX
变量值:tessdata文件夹路径

然后在pycharm中 下载pytesseract
pip install pytesseract

下载完成后我们可以做一个小测试

测试图片:
02.png

测试结果:
Snipaste_2020-08-19_15-08-47.jpg

这样子就完成啦!

你可能感兴趣的:(python,pycharm,tesseract)