selenium模拟12306登录

#!/usr/bin/env python
# coding:utf-8
import requests
from hashlib import md5
from selenium import webdriver
import time
from PIL import Image
from selenium.webdriver import ActionChains
# 12306模拟登录过程
# 使用selenium打开登陆界面,对当前selenium打开的界面截图
# 对当前图片局部区域(验证码照片)进行裁剪,将验证码图片和模拟登录进行对应
# 使用超级鹰识别验证码获取图片坐标
class Chaojiying_Client(object):

    def __init__(self, username, password, soft_id):
        self.username = username
        password = password.encode('utf8')
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id
        self.base_params = {
     
            'user': self.username,
            'pass2': self.password,
            'softid': self.soft_id,
        }
        self.headers = {
     
            'Connection': 'Keep-Alive',
            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
        }

    def PostPic(self, im, codetype):
        """
        im: 图片字节
        codetype: 题目类型 参考 http://www.chaojiying.com/price.html
        """
        params = {
     
            'codetype': codetype,
        }
        params.update(self.base_params)
        files = {
     'userfile': ('ccc.jpg', im)}
        r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files,
                          headers=self.headers)
        return r.json()

    def ReportError(self, im_id):
        """
        im_id:报错题目的图片ID
        """
        params = {
     
            'id': im_id,
        }
        params.update(self.base_params)
        r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
        return r.json()



# chaojiying = Chaojiying_Client('g522627521', 'gxx963214785', '908202')  # 用户中心>>软件ID 生成一个替换 96001
# im = open('12306.jpg', 'rb').read()  # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要//
# print(chaojiying.PostPic(im, 9004)['pic_str'])  # 1902 验证码类型  官方网站>>价格体系 3.4+版 print 后要加()


# 使用selemium打开界面
# 加载selenium需要的驱动
driver_path = r'D:\chromedriver2\chromedriver.exe'
options = webdriver.ChromeOptions()
out_path = r'D:\固件下载合集\固件\TPLINK'  # 是你想指定的路径
prefs = {
     'profile.default_content_settings.popups': 0, 'download.default_directory': out_path}
options.add_experimental_option('prefs', prefs)
#options.add_argument('window-size=1920x3000')  # 指定浏览器分辨率
#options.add_argument('blink-settings=imagesEnabled=false')  # 不加载图片
#options.add_argument('--headless') #浏览器不提供可视化页面
driver = webdriver.Chrome(executable_path=driver_path, options=options)
url = 'https://kyfw.12306.cn/otn/login/init'
driver.get(url)
time.sleep(3)

# 对当前打开的页面截图
driver.save_screenshot('aa.png')

# 确定验证码图片对应的左上角和右下角对应的坐标(裁剪的区域)
code_img_ele = driver.find_elements_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img')

location = code_img_ele.location  # 返回的是验证码左上角的坐标
size = code_img_ele.size  # 验证码标签对应的长和宽
# 左上角和右下角的坐标
rangle = (
    int(location['x']), int(location['y']), int(location['x'] + size['width']), int(location['y'] + size['height']))
# 至此验证码图片区域确定下来
# 实例化image对象
i = Image.open('./aa.png')
code_img_name = './code.png'
# crop根据指定区域进行裁剪
frame = i.crop(rangle)
frame.save(code_img_name)

# 将验证码码图片提交给超级鹰
chaojiying = Chaojiying_Client('g522627521', 'gxx963214785', '908202')  # 用户中心>>软件ID 生成一个替换 96001
im = open('code.png', 'rb').read()  # 本地图片文件路径 来替换 a.jpg 有时WIN系统须要//
print(chaojiying.PostPic(im, 9004)['pic_str'])  # 1902 验证码类型  官方网站>>价格体系 3.4+版 print 后要加()
all_list = []  # 要存储即将被点击的点的坐标 [[x1,y1],[x2,y2]]
result = chaojiying.PostPic(im, 9004)['pic_str']
if '|' in result:
    list_1 = result.split('|')
    count_1 = len(list_1)
    for i in range(count_1):
        xy_list = []
        x = int(list_1[i].split(',')[0])
        y = int(list_1[i].split(',')[1])
        xy_list.append(x)
        xy_list.append(y)
        all_list.append(xy_list)
else:
    x = int(result.split(',')[0])
    y = int(result.split(',')[1])
    xy_list = []
    xy_list.append(x)
    xy_list.append(y)
    all_list.append(xy_list)
# 遍历链表,使用动作链对每一个列表元素对应的x,y指定的位置进行点击操作
for l in all_list:
    x = l[0]
    y = l[1]
    ActionChains(driver).move_to_element_with_offset(code_img_ele, x, y).click().perform()
    time.sleep(0.5)
driver.find_element_by_id('username').send_keys('xxxxxx')
time.sleep(1)
driver.find_element_by_id('password').send_keys('xxxxxx')
time.sleep(1)
driver.find_element_by_id('loginSub').click()
time.sleep(2)
driver.quit()

你可能感兴趣的:(爬虫)