selenium实现定位截图----获取验证码图片

获取验证码的步骤:

  • 浏览器最大化,截取整个网页,并保存
  • 定位验证码(通过id或class元素实现定位)
  • 获取验证码的x,y坐标轴,以及长宽,形成我们需要获取的位置坐标
  • 打开之前保存的网页截图,从中截取验证码
  • 保存验证码,等待识别

这里我们以搜狗微信公众号的验证页为例,实现验证码的定位截取。

# encoding:utf-8
from PIL import Image
from selenium import webdriver

url = 'https://weixin.sogou.com/antispider/?from=http%3A%2F%2Fweixin.sogou.com%2Fweixin%3Ftype%3D2%26query%3Dpython'
driver = webdriver.Chrome()
driver.maximize_window()  # 将浏览器最大化
driver.get(url)
# 截取当前网页并放到D盘下命名为printscreen,该网页有我们需要的验证码
driver.save_screenshot('D:\\python371\\python_wordspace\\img\\printscreen.png')
imgelement = driver.find_element_by_id('seccodeImage')  # 定位验证码
location = imgelement.location  # 获取验证码x,y轴坐标
print(location)
size = imgelement.size  # 获取验证码的长宽
print(size)
rangle = (int(location['x']+110), int(location['y']+60), int(location['x'] + size['width']+165),
          int(location['y'] + size['height']+90))  # 写成我们需要截取的位置坐标
i = Image.open("D:\\python371\\python_wordspace\\img\\printscreen.png")  # 打开截图
frame4 = i.crop(rangle)  # 使用Image的crop函数,从截图中再次截取我们需要的区域
frame4=frame4.convert('RGB')
frame4.save('D:\\python371\\python_wordspace\\img\\save.jpg') # 保存我们接下来的验证码图片 进行打码

driver.close()

结果:

selenium实现定位截图----获取验证码图片_第1张图片

之后再对截取的验证码进行识别,模拟输入就行了。

你可能感兴趣的:(爬虫,python,爬虫)