python+selenium实现中国铁路12306自动登录

涉及到的知识点:

  1. selenium自动化测试工具的使用(基本的点击,输入文本,执行动作链)
  2. 12306图片验证码的破解(点选类验证码)

实现的效果:

案例代码:

from selenium import webdriver
from selenium.webdriver import ActionChains
import base64
import requests
import re
import time
def login():
    username = 用户名
    password = 密码
    driver.get('https://kyfw.12306.cn/otn/resources/login.html')
    driver.maximize_window()
    #driver.set_window_size(1600,900)
    # 隐式等待
    driver.implicitly_wait(10) # 10秒钟内只要找到了元素就开始执行,10秒钟后未找到,就超时;
    # 使用隐式等待的目的是确保页面元素全部加载完毕以后,再进行后面代码的运行
    """
    implicitly_wait():隐式等待
    当使用了隐式等待执行测试的时候,如果 WebDriver没有在 DOM中找到元素,将继续等待,超出设定时间后则抛出找不到元素的异常
    换句话说,当查找元素或元素并没有立即出现的时候,隐式等待将等待一段时间再查找 DOM,默认的时间是0
    一旦设置了隐式等待,则它存在整个 WebDriver 对象实例的声明周期中,隐式的等到会让一个正常响应的应用的测试变慢,
    它将会在寻找每个元素的时候都进行等待,这样会增加整个测试执行的时间。
    """
    driver.find_element_by_xpath('/html/body/div[2]/div[2]/ul/li[2]/a').click()
    driver.find_element_by_xpath('//*[@id="J-userName"]').send_keys(username)
    driver.find_element_by_xpath('//*[@id="J-password"]').send_keys(password)
    # 图片验证码 是一个base64字符串
    img_url = driver.find_element_by_xpath('//*[@id="J-loginImg"]').get_attribute('src')
    """
    base64是 将图片二进制的数据转换成了字符串的形式
    优点:1.可以在网速不好的时候优先于内容加载(它放在了css样式里,渲染的时候比请求一个图片的链接地址要快)
          2.减少了http请求
          3.没有请求,减少了服务器的负担
    """
    print('验证码的url',img_url)
    get_image(img_url)
    ysm_result = yzm_resolve()
    # 点击输入验证码
    click_yzm_result(ysm_result)
    # 点击登录
    driver.find_element_by_xpath('//*[@id="J-login"]').click()
    # 再次进行隐式等待
    driver.implicitly_wait(10)
def get_image(img_url):
    """base64图片的解码,保存图片"""
    # 数据的分割
    base64_url = img_url.split(',')[1]
    # 把base64字符串转化成二进制形式
    img_data = base64.b64decode(base64_url)
    with open('yzm.jpg',mode='wb') as f:
        f.write(img_data)
def yzm_resolve():
    """借助第三方接口识别验证码"""
    # http://littlebigluo.qicp.net:47720/
    img_data = open('yzm.jpg',mode="rb")
    file = {'pic_xxfile':img_data}
    url = 'http://littlebigluo.qicp.net:47720/'
    resp = requests.post(url=url,files=file)
    result = []
    for i in re.findall('(.*?)',resp.text)[0].split(' '):
        result.append(int(i))
    print("识别结果:",result)
    img_data.close()
    return result
def click_yzm_result(result):
    """控制鼠标点击验证码的结果 (动作链)"""
    # ActionChains
    img_element = driver.find_element_by_xpath('//*[@id="J-loginImg"]')
    print("初始化动作链中...")
    action = ActionChains(driver)
    for i in result:
        # 8个图片区域的像素点,这个根据自己电脑上的实际情况去写,利用截图工具大致算一算(以图片中心为0,0点)
        # MAP = [[-105,-20], [-35,-20], [40,-20], [110,-20], [-105,50], [-35,50], [40,50], [110,50]]
        MAP = [[-135,-45], [-45,-45], [45,-45], [135,-45],
               [-135,45], [-45,45], [45,45], [135,45]]
        # 1.2.3.4.5.6.7.8
        action.move_to_element(img_element).move_by_offset(MAP[i-1][0],MAP[i-1][1]).click()
        # 模拟人的操作,增加一定的延时
        time.sleep(1) # 休眠1秒钟
    # 执行动作链
    print("执行动作链")
    action.perform()
    time.sleep(1)
if __name__ == '__main__':
    driver = webdriver.Chrome()
    login()

你可能感兴趣的:(Python,python,selenium)