python之selenium入门(二)

上一篇文章中介绍了如何使用网页驱动来运行浏览器以及如何找元素(以Firefox和百度首页为例),这篇文章将会介绍如何登陆以及其他的一些操作。

(一)、selenium登陆(以Firefox为例)

from selenium import webdriver

#使用网页驱动来运行火狐浏览器
driver = webdriver.Firefox()
#XXXXX部分为登陆界面的网址链接
driver.get('XXXXX')
#找到账号输入框,把账号输入进去
driver.find_element_by_name('username').send_keys('username')
#找到密码输入框,把密码输入进去
driver.find_element_by_class_name('password').send_keys('password')
#找到登陆按钮,使用点击事件
driver.find_element_by_link_text('登陆').click()

(二)、时间等待

selenium  由网页驱动驱使浏览器进行操作,速度慢是一大特点,经常会出现代码执行完了,但是网页内容还没有加载完毕,里面的标签还没有显示出来,如果这时候操作里面的标签就会爆出异常 NoSuchElementExpection
            解决办法:时间休眠

1、time.sleep()

from selenium.webdriver.support.ui import WebDriverWait
from selenium import webdriver
import time

driver = webdriver.Firefox()
driver.get('http://www.baidu.com')
button = driver.find_element_by_id('su')
#程序休眠10秒钟之后继续执行
time.sleep(10)
button.click()

2、WebDriverWait

from selenium.webdriver.support.ui import WebDriverWait
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('http://www.baidu.com')
button = driver.find_element_by_id('su')
#网页等待直到标签显示出来
is_visible = WebDriverWait(driver,10).until(lambda driver:button.is_displayed())
print(is_visible)
button.click()

WebDriverWait和time.sleep()的相同点和不同点:

1、都是让程序等待执行的时间

2、time的时间是固定的,时间长短不会随着标签的加载速度而改变 # WebDriverWait时间是不固定的,等待多少时间要看                  标签的加载时间和指定的固定时间

3、如果在指定的时间内,标签仍然没有加载出来,那么time和WebDriverWait都会爆出异常

知道了这些基础知识,就可以使用selenium爬取数据了

 

 

你可能感兴趣的:(python之selenium入门(二))