Selenium 简介
Selenium是一个自动化测试工具,利用它可以驱动浏览器执行特定的操作例如点击、下拉等操作。同事它还能够获取浏览器当前呈现的页面的源代码,即可以做到可见可爬。这对于一些JavaScript渲染的页面我就就可以使用它进行爬取,而不用去分析后台接口参数。#应用:(以google浏览器为例))安装selenium并且将google驱动chromedirver.exe程序与python代码文件的放置在同一个目录中,即可使用selenium驱动google浏览器.以下为一个简单示例:
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.wait import WebDriverWait #声明浏览器对象(也可以是其他浏览器:火狐、IE等) browser = webdriver.Chrome() try: #访问页面 browser.get('https://www.baidu.com') input = browser.find_element_by_id('kw') input.send_keys('python') input.send_keys(Keys.ENTER) wait = WebDriverWait(browser,10) wait.until(EC.presence_of_element_located((By.ID,'content_left'))) print(browser.current_url) print(browser.get_cookies()) print(browser.page_source) finally: browser.close() 结果(输出当前url,源代码,cookies) .............................................................................................省略