1.XPath简介
XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。
XPath 使用路径表达式在 XML 文档中进行导航,XPath 包含一个标准函数库,XPath 是 XSLT 中的主要元素,XPath 是一个 W3C 标准
XPath 路径表达式,XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
XPath 标准函数:XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。
2.XPath节点
2.1.术语
在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。
基本值(或称原子值,Atomic value):基本值是无父或无子的节点。
基本值的例子:J K. Rowling,"en"
项目(Item):项目是基本值或者节点。
2.2.节点关系
父(Parent):每个元素以及属性都有一个父。在上面的例子中,book 元素是 title、author、year 以及 price 元素的父
子(Children):元素节点可有零个、一个或多个子。在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子
同胞(Sibling):拥有相同的父的节点。在下面的例子中,title、author、year 以及 price 元素都是同胞:
先辈(Ancestor):某节点的父、父的父,等等。在上面的例子中,title 元素的先辈是 book 元素和 bookstore 元素:
后代(Descendant):某个节点的子,子的子,等等。在下面的例子中,bookstore 的后代是 book、title、author、year 以及 price 元素:
3.XPath 语法
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
3.1选取节点:XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。
3.2谓语(Predicates)谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。
3.3选取未知节点:XPath 通配符可用来选取未知的 XML 元素。
3.4选取若干路径:通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
4.XPath Axes(轴)
4.1.XPath 轴:轴可定义相对于当前节点的节点集。
4.2位置路径表达式:位置路径可以是绝对的,也可以是相对的。绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:
绝对位置路径:/step/step/...
相对位置路径:step/step/...
每个步均根据当前节点集之中的节点来进行计算。
5. XPath 运算符
6. XPath 实例
6.1选取所有 title。下面的例子选取所有 title 节点:
/bookstore/book/title
6.2选取第一个 book 的 title。下面的例子选取 bookstore 元素下面的第一个 book 节点的 title:
/bookstore/book[1]/title
6.3选取所有价格。下面的例子选取 price 节点中的所有文本:
/bookstore/book/price/text()
6.4选取价格高于 35 的 price 节点。下面的例子选取价格高于 35 的所有 price 节点:
/bookstore/book[price>35]/price
6.5选取价格高于 35 的 title 节点。下面的例子选取价格高于 35 的所有 title 节点:
/bookstore/book[price>35]/title