python提取图片文字

STEP1:安装pillow ,pillow-pil ,pytesseract

pip install pillow
pip install pillow-pil 
pip install pillow-pil

安装完后,可以用

pip list

查看是否安装成功。若是列表中有,则安装成功。

STEP2:安装Tesseract

 下载地址:Index of /tesseract

下载完成后双击.exe文件进行安装,语言包这个地方选一下(若是太慢,这个地方不选,后期再装语言包也可以),其他就直接下一步下一步就行,安装目录需要记住,后面添加环境变量需要用到

                

python提取图片文字_第1张图片

python提取图片文字_第2张图片

python提取图片文字_第3张图片

 安装完后添加环境变量,win + R 打开运行窗口,输入sysdm.cpl 或直接电脑属性->高级系统设置

python提取图片文字_第4张图片

或 

python提取图片文字_第5张图片

 python提取图片文字_第6张图片

python提取图片文字_第7张图片

 查看是否安装成功:

运行窗口输入cmd执行tesseract -v

tesseract -v

 出现版本号信息说明安装成功

 

        

具体可参考Tesseract-OCR 下载安装和使用_半濠春水的博客-CSDN博客_tesseract-ocr下载

STEP3:python代码提取文字

   文件目录:

python提取图片文字_第8张图片

test.jpg文件内容

python提取图片文字_第9张图片

 python代码

from PIL import Image
import pytesseract

def demo():
	image = Image.open('images/test.jpg')
	# lang='chi_sim'是设置成中文识别
	text = pytesseract.image_to_string(image,lang='chi_sim')
	print(text)


if __name__ == "__main__":
	demo()


 执行python index.py

输出结果:

python提取图片文字_第10张图片

 

 

 

你可能感兴趣的:(python,python,开发语言)