用深度学习破解12306图片验证码,识别率超96%- web效果版

    12306最新版图片验证码已被破解已是公开的秘密。比如市面上那么专业多抢票软件,早就破解了这个图片验证码。
    那他们到底是怎么实现的呢???
    据本人猜测,应该都是基于近2年流行的深度学习算法来实现的!因为毕竟目前深度学习最擅长图片、文字等处理。。

    为验证该猜想,作为一名深度学习业余爱好者和门外汉,我也尝试整了一个算法来实现该功能,

    据我自己写了个自动登录12306网站的程序来验证该算法,登录了1000次,成功率竟高达96%!!!
    应该是对同一个账号,碰巧12306传回来的都是好识别的验证码的缘故吧。。。
    不过也付出了代价,因过于频繁登录,现在我的账号登录12306总是不大正常,不管验证码正确与否,登录成功率都低于60%,应该是被12306加入了黑名单???
    第一次写深度学习代码就达到这个效果,我自己都不敢相信,赶紧跟大家分享一下!!
    废话少说,先看效果:访问 http://littlebigluo.qicp.net:47720或 http://103.46.128.47:47720 网站,把验证码图片传上来,网站返回破解结果!!!
    破解结果对不对,你说了不算,我说了也不算,能经过12306网站登陆成功才算。。。
    千万不要写软件频繁自动登录,否则12306随后可能特殊对待你的账户哦。。
    
    普及一下,12306验证码图片大概是这个样子的:

    

   用深度学习破解12306图片验证码,识别率超96%- web效果版_第1张图片用深度学习破解12306图片验证码,识别率超96%- web效果版_第2张图片


    那机器算法如何破解呢???
    基本思想跟人一样,先想办法识别图片中的文字,然后在下面的8张图片中查找,看看哪几张图片最有可能是该文字所描述的图片???
    当然,查找的过程就需要用深度学习算法来实现。。
    因条件所限,学习的机器用的是一台2014年的旧笔记本,windows7 32位。机器学习下来要30多个小时。。
    所谓人工智能,就是要想机器有多智能,就得要付出多大的人工。。。
    如果花更多的时间,用更好的机器再调调学习参数,机器学习后登陆成功率接近人的识别率不是梦想呀。。
    对于那些专业做抢票软件的公司,人多机器好,验证码识别率肯定超过99%。。。。。
    不过俺目的只是想体验深度学习的功能,目标基本实现,就不再多花时间来追求更高的成功率。。。
    这个web网站也跑在我的旧笔记本上,而且只开了一个线程,所以性能和带宽和稳定性都非常有限,
    电脑也有可能会关机,如果碰到无法访问,请过一会再试试。。。我尽量保持电脑开机。。

    如果大家有意见或建议,请留言!!


   

你可能感兴趣的:(深度学习)