12306验证码识别V1.5

2013年初,可谓是12306订票软件最火的时候,一时间各种订票软件蜂拥而出,什么51gohome,妈我回来了之类的,简直是太多了。但自从13年2月份左右吧,12306验证码经过一次升级,一时间大部分订票软件都不能识别验证码了,因为这次12306的验证码扎一看还是挺变态的,忽然感觉识别起来还是挺麻烦的,一时间无从下手。最近比较闲,就再看看12306的验证码识别。想想上次V1.4识别验证码获取特征码十分麻烦,基本都是手动提取样本,累得慌。这次就想写个验证码分析器,以后采集处理样本就方便多了。

识别方法无非就是采样,匹配而已。这次噪点不好去,去的话容易把字母给去掉,暂时还没想到什么好的办法。所以用的模糊识别,算出匹配度最高的一个字母,我这边设定的阀值是80%。就目前来看还可以。

12306验证码识别V1.5_第1张图片


经过一天的样本采集,测试了下,随便写了个Demo测试下效果还凑合,随便测了下,识别率能到达80%左右吧,


12306验证码识别V1.5_第2张图片


12306验证码识别V1.5_第3张图片

12306验证码识别V1.5_第4张图片



你可能感兴趣的:(C#)