【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结

     在使用tesserorc 时  博主也遇到了诸多问题   在经过 四处碰壁 与 资料查找后 最终安装成功,并成功的完成了图像识别 , 事后总结这这一条阳光大道 , 方法仅供参考  ,  希望 对 各位正处于到坑中的小伙伴们有所帮助  .   如果您有更好的方法 , 欢迎评论  或 留下 您的 传送门

 

1丶 先下载安装tesseract

            下载链接:http://digi.bib.uni-mannheim.de/tesseract

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结_第1张图片

 

2 丶安装OCR:(安装成功后,配置好环境)

            勾选语言选项的时候,只要勾选需要的语言就好,不必要全选 不然安装的太慢了

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结_第2张图片

       2.1 : 安装完毕后 进入cmd窗口进入安装程序路径下 执行命令:  tesseract -v    如果显示如下图,则表示成功

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结_第3张图片

3 丶去下面网址找到 python版本 和 window系统版本 相对应的  whl 文件

https://github.com/simonflueckiger/tesserocr-windows_build/releases

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结_第4张图片

 

4丶文件下载成功后 : 进入项目文件下的执行下面的命令 ( filename 为 下载的 whl文件名)

             pip install filename.whl

显示安装成功提示就表示安装成功了:

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结_第5张图片

 

5 丶 环境搭好后 就能对图像进行识别了:

 简单实例:
from PIL import Image
import tesserocr
# 创建一个Image 对象
image = Image.open('yzm.jpg')

# 调用方法image_to_text() ,完成Image对象的识别
resul = tesserocr.image_to_text(image)
print(resul)
print(type(resul))
 

你可能感兴趣的:(Python爬虫,验证码识别)