Xpath路径学习笔记

xpath使用路径表达式来获取xml文档中的节点和节点集合
节点是沿着路径(path)或者(steps)来获取的。
下面给出最常用的路径表达式
表达式 描述
nodename 选取此节点的所有子节点
/ 从根节点开始选取
// 从匹配选择的当前节点选择文档中的节点而不考虑他们的位置
. 选取当前的节点
.. 选取当前节点的父节点
@ 选取属性

在这里我以stackflow页面为例进行分析:
Xpath路径学习笔记_第1张图片

选取第一个问题分析:
$x(‘//*[@id=”question-summary-37072678”]/div[2]’)
结果如下:
这里写图片描述

也就是选择了id为question-summary-37072678的元素下面的第二个div元素也就是关于问题的部分提炼出来了
$x(‘//div[@class=”summary”]/h3’)
这里写图片描述
作用选取class属性值为summary下的所有h3标签
$x(‘//div[@class=”summary”]/h3/a[@class=”question-hyperlink”]/text()’)
Xpath路径学习笔记_第2张图片
意义在于,有效的选择了class属性为div的模块下面的h3标签里面的a标签的内容

另外补充一下:
通配符:
* 匹配任何的节点元素
@* 匹配任何属性节点
node() 匹配任何类型的节点
如下:
Xpath路径学习笔记_第3张图片

你可能感兴趣的:(xml,xpath)