selenium模拟登陆淘宝,获取cookies

新年工作第一天,再次祝大家新年快乐,猪年大吉!

1、前言,前期准备

这次分享一下模拟登陆淘宝实记。淘宝作为中国几大电商网站之一,反爬措施可以说是相当完善的,在这里我会分享出我是如何使用selenium成功登陆淘宝的。首先请配置好selenium操作谷歌浏览器,然后就是准备好一个淘宝账号密码,最后是准备好fiddle抓包工具。

2、发现问题

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2019/2/11
# @Author  : Andy丶Tao
# @File    : tabao.py
# @Software: PyCharm
import time
import random
from selenium import webdriver
from selenium.webdriver import ActionChains

driver = webdriver.Chrome()
driver.get('https://login.taobao.com/member/login.jhtml')
driver.maximize_window()  # 窗口最大化
driver.implicitly_wait(3)
driver.find_element_by_id('J_Quick2Static').click()
time.sleep(random.random()) # 随机休眠0-1秒
# 输入账号密码
driver.find_element_by_id('TPL_username_1').send_keys('淘宝账号') # 淘宝账号
time.sleep(random.random())
driver.find_element_by_id('TPL_password_1').send_keys('淘宝密码') # 淘宝密码
time.sleep(random.random())
# 模拟滑动
getcheck = driver.find_element_by_id('nc_1_n1z')
ActionChains(driver).click_and_hold(on_element=getcheck).perform()
ActionChains(driver).move_to_element_with_offset(to_element=getcheck, xoffset=120, yoffset=2).perform()
time.sleep(0.1)
ActionChains(driver).move_to_element_with_offset(to_element=getcheck, xoffset=120, yoffset=2).perform()
time.sleep(0.3)
ActionChains(driver).move_to_element_with_offset(to_element=getcheck, xoffset=120, yoffset=2).perform()
time.sleep(0.9)
# 模拟点击
driver.find_element_by_id('J_SubmitStatic').click()
driver.close()

我们先常规操作一下使用selenium直接登陆淘宝会发现无论如何滑动滑块,始终通过不了淘宝验证,但是我们正常浏览器却可以直接登陆,看来淘宝对selenium控制的浏览器是有检测的,如何突破这个检测就是本篇的重点。

selenium模拟登陆淘宝,获取cookies_第1张图片

3、问题解决

首先我们在selenium控制的谷歌浏览器,和自己使用的谷歌浏览器上分别打开console面板,均输入window.navigator.webdriver,会发现返回值有所不同,正常浏览器返回的是false或者undefined,而selenium控制的谷歌浏览器却返回的是true,淘宝应该就是通过这个来检测selenium的。

selenium模拟登陆淘宝,获取cookies_第2张图片

 上图箭头所指为淘宝登陆的所加载的js,将这段js代码保存下来。并将下面代码加入到这段js当中。

Object.defineProperties(navigator,{

    webdriver:{

        get:() =>false

    }

})

selenium模拟登陆淘宝,获取cookies_第3张图片

 接下来就是替换了,将淘宝登陆加载的js替换成加载我们本地的js,这里就要用到我们的fiddle抓包工具。

首先打开fiddle进行抓包,运行一下我们最开始写的selenium登陆代码,抓一下这段代码所发出的请求。具体替换操作如下图:

selenium模拟登陆淘宝,获取cookies_第4张图片

上图步骤3的位置是自己本地路径。配置好之后,再次运行最开始的模拟登陆代码就可以成功登陆啦! 

更新版入口

你可能感兴趣的:(Python,爬虫,selenium)