爬虫使用senium跳过webdriver检测

当使用selenium进行自动化操作时,在chrome浏览器中的consloe中输入windows.navigator.webdriver会发现结果为Ture,而正常使用浏览器的时候该值为False。所以我们将windows.navigator.webdriver进行屏蔽。

在代码中添加:

   chromedriver_path="D:\\google\\chromedriver.exe"#驱动链接
   options = webdriver.ChromeOptions()
   # 此步骤很重要,设置为开发者模式,防止被各大网站识别出来使用了Selenium
   options.add_experimental_option('excludeSwitches', ['enable-automation']) 
   driver = webdriver.Chrome(executable_path=chromedriver_path, options=options)
   options = webdriver.ChromeOptions()

同时,为了加快爬取速度,我们将浏览器模式设置为不加载图片:

    # 不加载图片,加快访问速度
    options.add_experimental_option("prefs", {"profile.managed_default_content_settings.images": 2}) 

参考链接:https://www.cnblogs.com/cloudbird/p/10524242.html

你可能感兴趣的:(爬虫学习)