python 简单验证码识别 自动登录 pytesser

pytesser的验证码识别能力比较低,只能对规规矩矩不歪不斜数字和字母验证码进行识别,这里还是要介绍下它的用法。有关它的安装和python对应的模块可以参考http://wenyue.me/blog/tag/pytesser

 

pytesser只能对tiff(tif)格式的图片文件进行识别,大部分网站的验证码图片不是tiff格式的,所以需要进行转换。

可使用Image模块转化图片格式

#需要保存成tmp.tiff,发现保存成tmp.tif的话pytesser无法识别

Image.open('tmp.gif').convert('RGB').save('tmp.tiff')

 

获取验证码的时候需要让对方服务器写如cookie,所以需要以下这段

jk = cookielib.LWPCookieJar()

cookies = urllib2.HTTPCookieProcessor(jk)

 opener = urllib2.build_opener(cookies)

然后再需要拿着这个opener去登录, 登录成功后的,再去请求其他需要登录的页面的时候也需要使用这个opener去urlopen 

你可能感兴趣的:(python,自动登录,验证码,pytesser,图片格式转化)