Python识别验证码的开源工具

各位“蜘蛛侠”们大家可能在抓取页面中的 验证码 而耿耿于怀,关于这点我想我目前可能能帮助下大家,在python中找到最接近与“杀手级别”的 工具 (源于 开源 ,好东西不敢独享)。

调下大家的积极性 ,上图



python 包>> pytesser|  http://code.google.com/p/pytesser/ (其实 py包 使用很简单的,关键在 安装

1. 首先安装 pil : easy_install --find-links  http://www.pythonware.com/products/pil/  Imaging

2. pytesser 依赖包 
tesseract-ocr|  http://code.google.com/p/tesseract-ocr/downloads/list  

tesseract-ocr 依赖库| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz  解压到 你安装的tesseract-ocr的识别学习库下。

你可能感兴趣的:(python)