国税局验证码识别

更新于2020年12月28日

说下国税局的验证码,国税局的验证码是数字+字母+汉字,数字就是0~9,字母就是大写的26个英文字母,字体是一种叫做actionj的字体,大家有兴趣可以搜索下很好找到。真实的验证码如下如所示
国税局验证码识别_第1张图片

你看这个验证码它又大又圆(咳咳),背景是类似波浪的的条形图案加一个底色,所以有兴趣的小伙伴可以研究下,用Python就可以写出来。字体的颜色就是四种,分别为黑色、红色、黄色、和蓝色。这种验证码的难处就在于存在汉字导致训练很难收敛或者就是准确率只有50~60%。这里提供一种识别模型,那就是crnn,通过ctc对齐,当然不一定是最好的,但是很有效,个人通过这种模型测试10000张可以达到97%左右的识别率,小伙伴们也来试试吧,关于crnn的代码网上有很多,有兴趣的小伙伴可以去找一下。欢迎随时csdn交流或留言。

你可能感兴趣的:(国税局验证码识别,验证码识别,深度学习)