如何确保答题打码平台自动识别验证码的准确率

             一、常见的验证码图形

            1、数字验证码

            2、字母验证码

            3、数字字母组合

            4、汉字验证码

            二、验证码识别技术

           这是网络中最常用的验证码。它易产生,具有标准答案,不受背景知识和文化差异的影响,暴力破解复杂度很大。几乎所有的国内网站和大部分的国外网站都是采用此种验证码。此类验证码是系统在用户访问页面时随机产生的一个图像,图像中包含数字、字母或其他文字。其中字符序列与背景图像进行信息融合,添加干扰噪声,或对图像进行混杂、扭曲、粘连、变形等处理,以增加图像识别的难度。这也是我们的研究对象。

          如何确保答题打码平台自动识别验证码的准确率_第1张图片

(图片来源:www.dati8.com)


            三、验证码识别的准确率(以答题吧打码平台为例)


1、平台开发研究要重点研究了用于字符识别的BP神经网络、卷积神经网络和形状上下文算法,给出详细的推导。

2.采用分段线性变换去除图像模糊,利用局部OSTU二值化,得到了比全局阈值更好的分割结果。对传统的投影分割法改进,提出了极小值分割算法,有效解决了验证码字符粘连的问题。并采用简化后的卷积神经网络进行字符训练和识别,达到了 99.1%的高识别率。

3.聚类算法和竖直投影结合的方式完成分割,解决了字符叠加和粘连的难题。对单个字符以简化后的卷积神经网络进行训练和识别,识别率达到了 53%。

4.对已有的难以分割的验证码,提出了基于形状上下文整体识别验证码的方法,破解率达到了  27.7%。这种整体识别的思想也给其他较难分割的验证码提供了一个新的识别思路。  

      

你可能感兴趣的:(如何确保答题打码平台自动识别验证码的准确率)