来一篇自助打卡脚本(简单验证码识别)

搬砖居然要打卡,咩呀!臣妾做不到啊!于是只好想定时任务自助打卡馊主意。

打卡机制描述:

用账号密码登录到签到页面,然后输入四位数字验证码,点击签到。

一开始想直接执行js脚本(selenium.execute_script),签到。发现验证其实是带到服务端做的,所以此路不通。

于是只好上tesserocr加持我打卡。安装精髓看这里。tesserocr其实是在用tesseract,所以act要好好装好。版本都瞄对。https://github.com/simonflueckiger/tesserocr-windows_build/releases

基本步骤就是selenium 开IE 登录,然后全屏截图,然后像素分析验证码位置,然后上tesserocr 识别。

最后的最后,tesseract 是要训练下才能有较高识别率的。特别鸣谢:https://blog.csdn.net/a745233700/article/details/80175883

 

基础代码:

from selenium import webdriver

userName="wobuxiangshangban"
loginUrl = "www.shangbanqu.com"
signUrl = "www.shangbanqu.com/qiandao/"
loginPwd = "haishibuxiangshangban"

web = web.driver("C:\Program Files\internet expolorer\IEDriverServer.exe")
web.get(loginUrl)

elem = web.find_element_by_id("userLoginName")
elem = send_keys(userName)

elem = web.find_element_by_id("userPwd")
elem = send_keys(loginPwd)

elem = web.find_element_by_xpath("//button[@class='submit']")
elem.click()

web.get(signUrl)

web.save_screenshot('mainPage.png')

#识别验证码部分

from PIL import Image
import tesserocr as tes

mainPage = Image.open("mainPage.png")
box = (1067,349,1154,392)  #验证码的固定位置
codeImg = mainPage.crop(box)
codeImg.save("codeImg.png")

codeImg = Image.open("codeImg.png")
tes.image_to_text(codeImg)

imgGray = codeImg.convert("L")
img_bw = imgGray.point(lambda x:255 if x > 120 else 0) #二值化,就是黑白照啦

tes.image_to_text(img_bw)

 

你可能感兴趣的:(Python,tesserocr)