模拟登录淘宝chromedriver被识别怎么办?

虽然chromedriver已经可以可以使用浏览器登录了,但是由于浏览器还是被chromedriver控制的,chromedriver有一些特性可以被js感知到,所以很多网站可以在网站中加入js逻辑来判断当前的浏览器是否是由driver控制,比如检测是否存在特有标识$cdc_lasutopfhvcZLmcfl、window.navigator.webdriver:
 1. 解决上面的问题$cdc_lasutopfhvcZLmcfl 需要去修改driver文件,具体修改方法(https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver) ,windows和linux下修改过的文件可以到这里下载(https://git.imooc.com/coding-92/coding-92/src/master/chrome_nocdc), chrome使用73版本: 

2. 解决window.navigator.webdriver的方法可以通过:


   option = webdriver.ChromeOptions()
   option.add_experimental_option('excludeSwitches', ['enable-automation']) #这里去掉window.navigator.webdriver的特性


下面给出简单的模拟淘宝登录的代码:

    from selenium import webdriver
    option = webdriver.ChromeOptions()
    option.add_experimental_option('excludeSwitches', ['enable-automation']) #这里去掉window.navigator.webdriver的特性

    domain = "https://www.taobao.com/"

    #下面的chromedriver.exe使用特殊的可执行文件,去掉了$cdc_lasutopfhvcZLmcfl等特性
    browser = webdriver.Chrome(executable_path="C:/360安全浏览器下载/chromedriver_win32/test/chromedriver.exe", options=option)
    import time
    browser.get(domain)
    browser.find_element_by_xpath('//*[@id="J_SiteNavLogin"]/div[1]/div[1]/a[1]').click()
    time.sleep(5)
    browser.find_element_by_xpath('//*[@id="J_Quick2Static"]').click()
    time.sleep(5)
    username_el = browser.find_element_by_id("TPL_username_1")
    #淘宝会检测输入的速度,所以控制一下输入速度
    username = "xxx"
    for character in username:
        username_el.send_keys(character)
        time.sleep(0.3) # pause for 0.3 seconds

    pwd_el = browser.find_element_by_id("TPL_password_1")
    password = "xxx"
    for character in password:
        pwd_el.send_keys(character)
        time.sleep(0.3) # pause for 0.3 seconds

    time.sleep(2)
    browser.find_element_by_id("J_SubmitStatic").click()
    time.sleep(5)
    time.sleep(20)

你可能感兴趣的:(python)