微博模拟登陆之验证码的解决方法

近两周有很多在qq群中有很多群友讨论关于微博类爬虫时出现验证码时的解决方法,解决思路很明显,一是人工打码,二是OCR智能识别来解决,前者较简单,后者较难只有大公司才能搞定80%,所以我们一般暂采取人工打码的方式。

   但人工打码,并这里我强调的稍智些的人工打码,而去看浏览器去监测然后再在浏览器中去打码的过程,该实现过程太过啰嗦。本文介绍共享的验证验解决方法,是自动发现验证码,并把验证码通过JAVA的GUI程序将验证码弹出让人输出即可,也可以多次输入,直接输入正确为止,大概的验证码打码样式,如下图:

微博模拟登陆之验证码的解决方法_第1张图片

输入相应的值后提交,系统会自动将验证码和用户名、密码等参数,一起post到微博平台的登陆接口中,从而得到最终正确的cookies,从而进行下一步的数据抓取。

你可能感兴趣的:(天亮培训,天亮教育,天亮教育相关课程)