window10使用、安装Tesseract-OCR(pytesseract基础入门)

下载Tesseract-OCR

GitHub 地址:https://github.com/tesseract-ocr/tesseract/releases
Windows版本Tesseract各版官方下载地址:https://digi.bib.uni-mannheim.de/tesseract
选择什么版本看自己需求,参考其他博客都是选择dev版本,大家随意
Python使用Tesseract-OCR的第三方库:

pip install pytesseract

配置系统环境变量

直接跳过,其他博客都有,而且我这里只是想使用pytesseract这个库做orc识别,不涉及到其他使用,所以就不给大家截图过程了

使用pytesseract库完成OCR识别

from PIL import Image
import pytesseract
# Tesseract-OC安装路径改成自己的,使用这种方式更改tesseract_cmd变量可不配置系统环境变量
pytesseract.pytesseract.tesseract_cmd = 'D:\\IdeTools\\Tesseract-OCR\\tesseract.exe'
image = Image.open('./data/test.jpg')
code = pytesseract.image_to_string(image,lang='chi_sim')
print(code)

你可能感兴趣的:(Python,python,pip)