基于Python的Selenium自动化(3)— 实现验证码截取并识别

这些天实在忙的冒烟,一大堆的项目堆在一起,没日没夜的加班。加上有些懒惰,学习进度一直没有太多进展。这篇文章主要介绍前段时间抽空实现的一个功能,希望有需要用到可以得到一点启发。

基于UI层的自动化,有一些坑在里面,几乎几个每个人都会遇到的,其中之一就是注册或登录时需要验证码。由于验证码时动态生成的。每次访问都会不同,这样的话,使用脚本去登录会是一件麻烦的事。
目前有的一些解决方案:
1、针对公司内部的项目有两个方法,
(1)设置一个万能验证码,只要每次填写这个验证码就可以验证通过
(2)将手机号设置为白名单,只要输入特定的手机号,则不校验验证码
2、针对外部项目则可使用下面的方法
(3)截取验证码部分并使用图片识别技术识别
本文主要介绍(3)的实现过程。仅供参考
步骤可分为截取验证码+识别验证码
一、截取验证码
selenium webdriver 的api中直接提供了截图的方法.但是是全屏,要实现对元素的截取,则需要绕一绕弯
1、获取到元素的大小、元素的坐标
2、截取整屏
3、根据元素的坐标和大小,定位要剪裁的区域
4、使用图像库对元素区域进行剪裁
python代码实现:

        driver.get_screenshot_as_file('a.jpg')
        location = driver.find_element_by_id('validate-img').location
        size = driver.find_element_by_id('validate-img').size
        left = location['x']
        top =  location['y']
        right = location['x'] + size['width']
        bottom = location['y'] + size['height']
        a = Image.open("a.jpg")
        im = a.crop((left,top,right,bottom))
        im.save('a.jpg')
        time.sleep(1)

代码没有注释部分,解释起来就是上面的四个步骤

二、识别验证码
本文不设计如何实现验证码,这部分的任务我选用的是第三方的API来实现的。(如有需要,可以搜索“超级鹰验证码识别”)毕竟术业有专攻,如果要做OCR识别的同学,本文没有任何参考价值,就此略过

你可能感兴趣的:(selenium)