selenium对web各元素的操作首先就要先定位元素,定位元素的方法主要有以下几种:
以百度首页为例:下面是百度输入框的html代码,可以通过firebug或者谷歌的审查元素或得
autocomplete="off">
1.通过id定位,则百度的输入框即可表示为:find_element_by_id("kw1")
2.通过name定位则可以表示为:find_element_by_name("wd")
3.通过tag_name定位:input其实就是tag_name(标签名),同样也可以表示成:
find_element_by_tag_name("input")
下面是“百度一下”按钮的html
class="btn_wr">
type="submit" value="百度一下" id="su1" class="btn" οnmοusedοwn=
"this.className='btnbtn_h'" οnmοuseοut="this.className='btn'">
4.通过class_name定位,“百度一下”按钮则可以表示成find_element_by_class_name("btn_wr")
5.通过css定位,这个比较灵活,想要完全弄懂,花费的时间是
比较多的,个人觉得没有必要
百度输入框
type="text" name="wd"id="kw1" maxlength="100"style="width:474px;" autocomplete="off">
<a class="RecycleBinxz" href="javascript:void(0);">
6.通过XPath定位
首先我们要了解XPath是上面东西,XPath是一种在XML
文档中定位元素的语言。因为HTML可以看做XML的一种实现,
所以selenium用户可是使用这种强大语言在web应用中定
位元素,详情请阅读:
什么是XPath:http://www.w3.org/TR/xpath/
XPath基础教程:http://www.w3schools.com/xpath/default.asp
selenium中被误解的XPath :
http://magustest.com/blog/category/webdriver/
xpath:attributer(属性)
driver.find_element_by_xpath("//input[@id='kw1']")
表示input标签下id =kw1的元素
xpath:idRelative(id相关性)
driver.find_element_by_xpath("//div[@id='fm']/form/span/input")
表示在/form/span/input层级标签下有个div标签的id=fm的元素
driver.find_element_by_xpath("//tr[@id='check']/td[2]")
表示id为'check'的tr,定闪他里面的第2个td
xpath:position(位置)
driver.find_element_by_xpath("//input")
driver.find_element_by_xpath("//tr[7]/td[2]")
表示第7个tr里面的第2个td
xpath: href(水平参考)
driver.find_element_by_xpath("//a[contains(text(),'网页')]")
表示在a标签下有个文本(text)包含(contains)'网页' 的元素
xpath:link
driver.find_element_by_xpath("//a[@href='http://www.baidu.com/']")
表示有个叫a的标签,他有个链接href='http://www.baidu.com/的元素
7.通过link定位
有时候不是一个输入框也不是一个按钮,而是一个文字链接,我们可以通过link
#coding=utf-8
from seleniumimport webdriver
import time
df = webdriver.Firefox() #选择firefox浏览器
df.get("http://www.baidu.com") #打开百度网页
time.sleep(2) #暂停2秒,不是毫秒
df.find_element_by_link_text("贴 吧").click() #点击贴吧链接
time.sleep(2)
df.quit() #关闭浏览器
Partial Link Text 定位
通过部分链接定位,这个有时候也会用到,我还没有想到很好的用处。拿上面的例子,我可以只用链接的一部分文字进行匹配:
browser.find_element_by_partial_link_text("贴").click()
通过find_element_by_partial_link_text()函数,我只用了“贴”字,脚本一样找到了"贴吧"的链接