爬虫------动态HTML处理

1、导入webdriver

from selenium import webdriver
import time

 

2、调用环境变量指定的PhantomJs浏览器创建浏览器对象

driver = webdriver.PhantomJs()

3、如果没有在环境变量执行的PhantomJs位置

需要手动加入

webdriver.PhantomJS(executable_path = r"C:\Users\Administrator\Desktop\phantomjs-2.1.1-windows\bin\phantomjs.exe")

4、请求页面

driver.get("https://www.baidu.com/")
print(driver.page_source)

5、截屏工具

driver.save_screenshot('01.png')
with open('baidu.html','w',encoding='utf-8') as fp:
    fp.write(driver.page_source)

6、在搜索框输入内容

爬虫------动态HTML处理_第1张图片

driver.find_element_by_id('kw').send_keys("易烊千玺")
driver.save_screenshot('02.png')

7、点击百度一下

爬虫------动态HTML处理_第2张图片

driver.find_element_by_id('su').click()
# 留出充足的时间等待响应
time.sleep(6)
driver.save_screenshot('03.png')

8、结果

爬虫------动态HTML处理_第3张图片

 

爬虫------动态HTML处理_第4张图片

爬虫------动态HTML处理_第5张图片

 

你可能感兴趣的:(爬虫------动态HTML处理)