基于OCR的验证码识别方案

因为大多验证码都加有干扰因子(杂点、字符不规则排列),直接用OCR技术进行验证识别,识别率往往比较低。

鲲鹏数据技术人员通过测试发现将验证码先进行一系列的优化处理后,再使用ORC进行识别,识别率会有非常大的提高。

例如,类似如下的验证码使用该方案识别率可高达100%。

 

该方案步骤如下:

原始的验证码(如下图所示):

基于OCR的验证码识别方案_第1张图片

1)对图像进行:中值过滤、亮度加强、二值化、降噪处理(如下图所示)。

基于OCR的验证码识别方案_第2张图片

2)对图像字符进行切片(如下图所示)。

第一个字符切片:
 

基于OCR的验证码识别方案_第3张图片

 

第二个字符切片:
 

基于OCR的验证码识别方案_第4张图片

 

第三个字符切片:
 

基于OCR的验证码识别方案_第5张图片

 

第四个字符切片:
 

基于OCR的验证码识别方案_第6张图片

 

第五个字符切片:
 

基于OCR的验证码识别方案_第7张图片

 

3)利用OCR依次识别每个字符。识别结果如下图所示:

 

基于OCR的验证码识别方案_第8张图片

 

特别说明:该文章为鲲鹏数据原创文章 ,你除了可以发表评论外,还可以转载到你的网站或博客,但是请保留源地址,谢谢!!(尊重他人劳动,你我共同努力)


http://www.site-digger.com/  
西安鲲之鹏网络信息技术有限公司 - 国内最专业Web数据采集服务提供商  
选择我们,所有数据都是你的!  
电话:13389148466(周先生)或   13571845363(齐先生)
QQ:1649677458 或 312602670
Email:[email protected]

你可能感兴趣的:(基于OCR的验证码识别方案)