XPath学习

XPath简介

  XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中通过元素和属性进行导航。XPath是W3C XSLT标准的主要元素,并且XQuery和XPointer都构建于XPath表达之上。因此,对XPath的理解是很多高级XML应用的基础。

XPath节点

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author> 
  <year>2005</year>
  <price>29.99</price>
</book>

</bookstore>
  • 节点(Node)

      在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。

      观察上面的XML文档,其中的节点例子:

         <bookstore>    (文档节点)
         <author>J K. Rowling </author>   (元素节点)
         lang="en"    (属性节点)
    
  • 基本值(或称原子值,Atomic value)

      基本值是无父或无子的节点。基本值的例子:

         J K. Rowling
         "en"
    
  • 项目(Item)

      项目是基本值或者节点。

  节点的关如下:

  • 父(Parent)

      每个元素以及属性都有一个父。在上面的XML文档中,book元素是title、author、year以及price元素的父。

  • 子(Children)

      元素节点可以有零个、一个或多个子。在上面的XML文档中,title、author、year以及price元素都是book元素的子。

  • 同胞(Sibling)

      拥有相同的父的节点。在上面的XML文档中,title、author、year以及price元素都是同胞。

  • 先辈(Ancestor)

      某节点的父、父的父、等等。在上面的XML文档中,title元素的先辈是book元素和bookstore元素。

  • 后代(Descendant)

      某个节点的子、子的子、等等。在上面的XML文档中,bookstore的后代是book、title、author、year以及price元素。

XPath语法

  下面的例子中我们将使用这个XML文档:

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>

<book>
  <title lang="eng">Learning XML</title>
  <price>39.95</price>
</book>

</bookstore>
  • 选取节点
      XPath使用路径表达式在XML文档中选取节点。下面是最有用的路径表达式:
表达式 描述
namenode 选取此节点的所有子节点
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
. 选取当前节点
.. 选取当前节点的父节点
@ 选取属性


  对应XML文档的实例:

路径表达式 结果
bookstore 选取bookstore元素的所有子节点
/bookstore 选取根元素bookstore。 注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径
bookstore/book 选取属于bookstore的子元素的所有book元素
//book 选取所有book子元素,而不管它们在文档的位置
bookstore//book 选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置
//@lang 选取名为lang的所有属性


  • 谓语(Predicates)

  谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。

  示例:

(含谓语的)路径表达式 结果
/bookstore/book[1] 选取属于bookstore子元素的第一个book元素
/bookstore/book[last()] 选取属于bookstore子元素的最后一个book元素
/bookstore/book[last()-1] 选取属于bookstore子元素的倒数第二个book元素
/bookstore/book[position()<3] 选取最前面的两个属于bookstore元素的子元素的book元素
//title[@lang] 选取所有拥有名为lang的属性的title元素
//title[@lang=’eng’] 选取所有title元素,且这些元素拥有值为eng的lang属性
/bookstore/book[price>35.00] 选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00
/bookstore/book[price>35.00]/title 选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00


  • 选取未知节点

  XPath通配符可用来选取未知的XML元素。

通配符 描述
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型的节点


  实例

路径表达式 结果
/bookstore/* 选取bookstore元素的所有子节点
//* 选取文档中的所有元素
//title[@*] 选取所有带有属性的title元素


  • 选取若干路径

  通过在路径表达式中使用”|”运算符,您可以选取若干个路径。

  示例

路径表达式 结果
//book/title | //book/price 选取book元素的所有title和price元素
//title | //price 选取文档中的所有title和price元素
/bookstore/book/title | //price 选取bookstore元素的book元素的所有title元素,以及文档中所有的price元素

你可能感兴趣的:(xml,xpath,w3c)