python pytesseract实现图片内容识别

python pytesseract实现图片内容识别

1.安装PIL
pip install pillow
2.安装pytesser3(我提前安装过了)
pip install pytesser3
3.安装pytesseract
pip install pytesseract
python pytesseract实现图片内容识别_第1张图片

4.安装autopy3
链接: https://pan.baidu.com/s/1fnsvIiKCdUWXRFNlVEAh3g
提取码: y9t7

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('a.jpg'),lang='chi_sim')
print(text)
# 南京免费代缴社保,公积金,注册公司,大学生租房补贴,联系方式:18855397334(微信同号)

5.将下载好的exe安装到指定目录(记好自己安装的目录)我的是E:\javaUtil\tesseract\Tesseract-OCR
python pytesseract实现图片内容识别_第2张图片

6.再把中文语言包拷贝到tessdata

python pytesseract实现图片内容识别_第3张图片
python pytesseract实现图片内容识别_第4张图片
7.修改pytesseract.py的路径指向tesseract.exe
python pytesseract实现图片内容识别_第5张图片
python pytesseract实现图片内容识别_第6张图片
python pytesseract实现图片内容识别_第7张图片

你可能感兴趣的:(python pytesseract实现图片内容识别)