Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;
Tesseract-OCR 下载地址传送门
jTessBoxEditor 下载地址传送门
Tesseract-OCR软件安装,我们不作介绍,很简单,不会的可以百度下
安装好的截图
cmd测试安装是否成功
tesseract可以识别验证码不假!可是不够准确,我们想要提高准确率,这时我们讲可以使用 jTessBoxEditor 来训练样本,提升识别的准确性!
【注意】:样本图像文件格式必须为tif\tiff格式,否则在Merge样本文件的过程中会出现 Couldn’t Seek 的错误。
打开jTessBoxEditor,Tools->Merge TIFF,将样本文件全部选上,并将合并文件保存为zhiTong.font.exp0.tif
我这里一直是(我这里虽然是tif格式的图片,依然出现了Couldn’t Seek 错误)
TiffToy.exe下载地址传送门
打开命令行【cmd】并切换至zhiTong.font.exp0.tif所在目录,输入,生成文件名为zhiTong.font.exp0.box
tesseract zhiTong.font.exp0.tif zhiTong.font.exp0 batch.nochop makebox
【语法】:tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox
lang为语言名称,fontname为字体名称,num为序号;在tesseract中,一定要注意格式。
打开jTessBoxEditor,BOX Editor -> Open,打开zhiTong.font.exp0.tif;
修改char对应位置的字符,修改完成后记得 【save】 保存
echo font 0 0 0 0 0 >font_properties
自动生成 font_properties文件
方法二:
直接在目标文件下,新建一个txt,命名为font_properties
在里边写内容:
font 0 0 0 0 0
#【注意】最后一定txt的文件后缀名去掉,也就是去掉".txt"
在【cmd】下执行批处理程序,一定要在cmd下找到目标文件下运行该命令:
echo Run Tesseract for Training..
tesseract.exe zhiTong.font.exp0.tif zhiTong.font.exp0 nobatch box.train
echo Compute the Character Set..
unicharset_extractor.exe zhiTong.font.exp0.box
mftraining -F font_properties -U unicharset -O zhiTong.unicharset zhiTong.font.exp0.tr
echo Clustering..
cntraining.exe zhiTong.font.exp0.tr
echo Rename Files..
rename normproto zhiTong.normproto
rename inttemp zhiTong.inttemp
rename pffmtable zhiTong.pffmtable
rename shapetable zhiTong.shapetable
echo Create Tessdata..
combine_tessdata.exe zhiTong.
我们将zhiTong.traineddata拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata(Tesseract-OCR安装位置 下的tessdata 下)
#一般我们网页识别验证码,是通过对网页验证码保存本地,然后在通过识别库,识别输出的
newImg = Image.open('C:/Users/Administrator/Desktop/pic/11.jpg')
text = pytesseract.image_to_string(newImg,lang='zhiTong')#lang='我们刚才新建的识别库'
print(text)
网页验证码处理:
def auto_img():
driver.get_screenshot_as_file("D:/test2/智通图片/img.jpg") #对整个网页
imgelement = driver.find_element_by_xpath('.//*[@id="captcha_image"]') # 定位验证码
location = imgelement.location # 获取验证码x,y轴坐标
size = imgelement.size # 获取验证码的长宽
rangle = (int(location['x'] + 10), int(location['y']), int(location['x'] + size['width'] - 20),
int(location['y'] + size['height'])) # 写成我们需要截取的位置坐标
i = Image.open("D:/test2/智通图片/img.jpg") # 打开截图
i = i.convert('RGB')
frame4 = i.crop(rangle) # 使用Image的crop函数,从截图中再次截取我们需要的区域
frame4.save('D:/test2/智通图片/new.jpg')
qq = Image.open('D:/test2/智通图片/new.jpg')
#我开始对图片,做了二值化处理,可以忽略
imgry = qq.convert('L') # 图像加强,二值化
sharpness = ImageEnhance.Contrast(imgry) # 对比度增强
sharp_img = sharpness.enhance(2.0)
sharp_img.save("D:/test2/智通图片/new1.jpg")
new2 = Image.open('D:/test2/智通图片/new1.jpg')
return code
至此,我们就可以实现验证码识别,自动验证登录功能!