python图像识别依赖包安装和环境配置

写这篇文章,目的是最近在做量化交易,有一个需求是访问比特币链上交易数据,监控大额资金转账,但账户只有一串地址码,无法识别是哪个交易所的,最后在金色财经https://www.jinse.com/bitcoin/232358.html找到了一些资料图片,想要将图片转为字符串码,于是有了下文。 

python图像识别依赖包安装和环境配置_第1张图片

 

一、安装pytesseract和PIL

   PIL全称:Python Imaging Library,python图像处理库,这个库支持多种文件格式,并提供了强大的图像处理和图形处理能力。

   由于PIL仅支持到Python 2.7,所以在PIL的基础上创建了Pillow库,支持最新Python 3.x。

 

  1、pip命令安装

    pip install pytesseract 

    pip install Pillow

  2、使用pycharm编辑器安装,如下操作步骤。 

 python图像识别依赖包安装和环境配置_第2张图片

python图像识别依赖包安装和环境配置_第3张图片

  安装成功:

  安装pytesseract时,同时安装pillow,所以我们只需安装pytesseract即可。

python图像识别依赖包安装和环境配置_第4张图片

    3.尝试运行,

源码如下: 

按 Ctrl+C 复制代码

 

按 Ctrl+C 复制代码

   出现报错,如下图,

   原因:没有安装识别引擎tesseract-ocr 

python图像识别依赖包安装和环境配置_第5张图片

点击返回目录

二、安装识别引擎tesseract-ocr

  1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别,经过改进引擎和训练系统,它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符,但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言(比如中文)上较慢,但是工作良好。

  下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

 python图像识别依赖包安装和环境配置_第6张图片

   因为tesseract-ocr默认不支持中文识别。 

   将下载到的文件:chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下,如图:

python图像识别依赖包安装和环境配置_第7张图片

   2,安装完成tesseract-ocr后,需要做一下配置 。

    在Python安装目录(如:D:\Python35\Lib\site-packages\pytesseract) 中修改 pytesseract.py文件。

 

    也可以通过pycharm,Ctrl+B 快速打开pytesseract源码文件:

python图像识别依赖包安装和环境配置_第8张图片

   3.尝试运行,出现如下报错:

  pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your   "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.') 

python图像识别依赖包安装和环境配置_第9张图片

   4.解决方法:将tessdata目录的上级目录所在路径:(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中,如下图:

    注意:配置完环境变量需要重新打开pycharm编辑器(IDE)。RUN----Edit Configgurations------

 

python图像识别依赖包安装和环境配置_第10张图片

 

python图像识别依赖包安装和环境配置_第11张图片

5.再次运行结果:图片识别成功!

  但识别率不是很高,后期优化,持续更新。 

python图像识别依赖包安装和环境配置_第12张图片

 

你可能感兴趣的:(python)