Xpath的使用

节点选择语法

/ 从根节点选取,获取标签下的文本用text(),例如:a/text() 获取a下的文本    a//text() 获取a下的所有标签的文本  //a[text()='下一页'] 通过文本进行定位

// 从匹配选择的当前节点选择文档中的节点,而不考虑他们的位置

. 选择当前的节点

.. 选择当前节点的父节点

@ 选取属性  例如:1.a/@href   2.//ul[@id='detail-list'] 定位属性

查找某些特定的节点或者包含某个指定的之的节点

//div/a[n] 选择div下的第n个a标签

//div/a[last()] 选择div下的最后一个a标签

//div/a[lase()-1] 选择div下的倒数第二个a标签

//div/a[position()<3] 选择div下的最前面两个a标签

选择未知节点

* 匹配任何元素节点

@* 匹配任何属性节点

node() 匹配任何类型的节点

选取若个路径

| 或,和 例如://div/a | //div/span 选取div下的所有a和所有span标签

在python中使用xpath

1.先下载lxml模块,pip install lxml

2.导入lxml模块中的etree库,from lxml import etree

3.利用etree.HTML,将字符串转化为Element对象

4.Element对象具有xpath的方法

        html = etree.HTML(response)

5.查看element对象中包含的字符串

         etree.tostring(html).decode()

你可能感兴趣的:(Xpath的使用)