waitalone大牛的博客:
http://www.waitalone.cn/python-php-ocr.html
这次验证码识别,我使用的python来实现的,发现python果然是强大无比,但是在验证码识别库的安装上面有点小问题。
关于python验证码识别库,网上主要介绍的为pytesser及pytesseract,其实pytesser的安装有一点点麻烦,所以这里我不考虑,直接使用后一种库。
python验证码识别库安装
要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。
1、PIL 下载地址:
PIL-1.1.7.win-amd64-py2.7.exe
PIL-1.1.7.win32-py2.7.exe
或者直接使用pillow来代替,使用方法基本没有什么区别。
http://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow
2、tesseract-ocr下载地址:
tesseract-ocr-setup-3.02.02.exe
3、pytesseract安装
直接使用pip install pytesseract安装即可,或者使用easy_install pytesseract
python验证码识别方法
#!/usr/bin/env python
# -*- coding: gbk -*-
# -*- coding: utf_8 -*-
# Date: 2014/11/27
# Created by 独自等待
# 博客 http://www.waitalone.cn/
try:
import pytesseract
from PIL import Image
except ImportError:
print '模块导入错误,请使用pip安装,pytesseract依赖以下库:'
print 'http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil'
print 'http://code.google.com/p/tesseract-ocr/'
raise SystemExit
image = Image.open('vcode.png')
vcode = pytesseract.image_to_string(image)
print vcode
识别率还挺高的,当然这也和验证码本身有关,因为这个验证码设计的比较容易识别。
验证码识别成功
python识别验证码,就是这么简单,大家还不快来试一试?
php验证码识别方法
关于php的验证码识别,这个我没有深入研究,但是用python实现完了以后就明白了,其实只要借助ocr识别库就可以了,直接贴上之前脚本关第9关的代码。
python实现的验证码识别破解实例请关注:
http://www.waitalone.cn/security-scripts-game.html
view source
01