Python3爬虫学习笔记(5.Selenium简单操作介绍)

这是一个很重要的模块,建议学会!

这里建议的介绍下,后面会结合实例详细分析

首先调出cmd,输入pip install selenium

然后输入相应的代码,发现出错,接下来就是让我用来一早上才弄好的:

必须到这个网站下载这个,然后把它放在系统PATH下面

https://github.com/mozilla/geckodriver/releases


访问页面:

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.baidu.com")
print(browser.page_source)
browser.close()
会弹出一个火狐浏览器,然后自动关闭,并打印网页源码


获取元素(举几个例子,其他的一样的用法):

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.baidu.com")
input_1 = browser.find_element_by_id("u")
input_2 = browser.find_element_by_css_selector("#u")
lis = browser.find_elements_by_css_selector("#u")
print(input_1, input_2)
print(lis)
browser.close()

元素交互操作(打开淘宝,输入iPhone然后清空,再次输入iPad后点击搜索):

from selenium import webdriver
import time
browser = webdriver.Firefox()
browser.get("http://www.taobao.com")
input_ = browser.find_element_by_id("q")
input_.send_keys("iPhone")
time.sleep(2)
input_.clear()
input_.send_keys("iPad")
button = browser.find_element_by_class_name("btn-search")
button.click()


执行JavaScript:

打开知乎并且到最底部,然后弹出一个框

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.zhihu.com/explore")
browser.execute_script("window.scrollTo(0, document.body.scrollHeight)")
browser.execute_script('alert("To Bottom")')

前进后退:

from selenium import webdriver
import time
browser = webdriver.Firefox()
browser.get("http://www.zhihu.com")
browser.get("http://www.baidu.com")
time.sleep(1)
browser.back()
time.sleep(1)
browser.forward()



你可能感兴趣的:(Python爬虫)